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几年以前，当我建玫我们大学的一个委 t 会把 :我们:二，年轉 
计课作为 —门被 推荐的课程列入公共修读课程计划中时，我第 jr 

次动机想写这本书。在赛亨，某儿位委员认为在赛炉木 学柃與 一木 

学士学位的自由教啬 feducation > 计划李有必婪列入这 

. p ■■ ■ | 1 c • __ 1 •- 

么 二门课 程是 不对趔 议晶 k 二意觅 搪，我逵惘才>^1。再次蜃 
考，委员会可能是正确的，我们麩这一谭申方 |是不 璋舍 T 个 ㈤ 

由教育学位的。 … .. … n 二:：二… 

第二次动机越写这本书是牟_年秋，郡蘇攀二年敦 
统计 * 我们用一本著名的初 等骞计的书' : fe 完 k | 朞耆率想达寧 
的几乎全都的要求 f 然而它九乎 全4的糸学 S 备告翕^未釦 
理统计书，结果根难使学生理解读统计的价值 I . . 

这本书并不楚不讲数学 I 然声 tt 次真堆 H . 论统计思，，騍 
用的数学其水平是初等酷：学生 U 释_是興明力， 虽涔他 们之中 
有一些缺乏数学修养。我希望这本丰介绍一筚学，生水平上的智女: 
经验。把统计与人类的历史，与人文学、 与广义的故学 、与世界上 
伟大的思想联系起来 —— 是赛合自由，孝育的。本书不是完全按照 
通常的思想顺序，甴概率到 估计和 检验， 绀织起 来的。 

它 倚短地 讨论统斗房史。这 包含亚里古多 德所给出的对面家 : 
的描述，德国和意大利学者们的国捂学 （ S ^ atenkunde )， 英国十: 

- a > ， ■ 

七世纪的政治算术，与赌博理论有关的概率的发展，以忍|:戶验 
设计的统计有关的实验科学的开始。 

还提出在统计发展中¥贡献的一些人的资料，使学生们知道 
—点 有关高 尔登、皮尔逊 1 费希尔和 “ Student ” 的知识。 

本书引入统计中许多重要思想和概念，诸如随机化，实验误 
差，罗瑟姆斯坦特 （ Rothamsted ) 学派的实验原则，中心极限定 



理，实验设计概念，统计4析所依据的數学摸型的思想，慨念上 

重复的总体的思想，以及统计方法在科学研究中的作用^ 

学生们应该知道统计中巨大的争论，它们的争论同时丰富和 

团结统计专业，和围绕着贝叶斯派统计己有数百年的争论。知道 

费希尔和皮尔逊的不和对试图掌握费希尔派和奈曼 —皮尔 逊派统 
计是有益的。 

学生还应认识到，统计这一学科仍在进展之中，最后一章至 

今尚未写出，就是统计学家还没有完全慊得如何收集和组织数 
据。 

本书的编排对某些人说来可能不遵守常规；分成36个短的演 
讲，每一演讲有一个标题，但没有次标题。这反映我通常是怎样 
组织一个一学期课程的：例如一个演讲关于正态分布， 一 个演讲 
关于普哇松分布采用本书的教疖可以添置他们自己的次 标题。 

本书有足够的丙容作为一个较传统式的统计课。这样一个课 
可安排如下：描述统计（演讲4〜6>,概率（演讲7和 8), 概率分布 
〈演 讲 K ) 〜12)，抽样分布 < 演讲13〜15)，检验（演讲 I 7 )，估计（演讲 

13)，相关和回归 （演讲 20和 23), t 检验（演讲 29), 方差分析 （演讲 
汕)，/检验（演讲 34 h > 

致 意 

这本手稿是在俄克拉何马州立大学开始和完成的，但大部分 

内容是我在1977到1973年问访问伦敦大学学院和伦敦皇家学院 
时写的《 

t 从略3 
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i>t “以 色列人出埃及地后，第二年 二月 和一 a,， 耶和，半疼 
西乃的旷野，会幕中晓谕摩西说，你要按以$列全会众的幕客、 
宗族，人名的数 S 计算所有的艿; T。 凡以色列中，★二十声 
能出去打仗的，你和亚伦要照他们的军队敷春”①/ .丨 . : 

(基督教）旧约第四卷就是以对摩西的这段训萊开始的，.要他 
去对以色列战士进行一次 ADHS 。 接下去的儿興累给比大约在 
公元前1500年举行的皁期调鸯铕皋。:霁际上 ，我们 知道在非常早 
以前为了税收就已作过 A 口调毐, A 们部清荤，.早在公元前三千 
年古代的巴比伦 V 宁學和埃及都己 k 行过人 C ? 谓査。」 

■- ■ ■ ■ . ■ .V ■ r ■ ■ ■ ■ ， 

■ 、 ■ ■ ■_ . 

«_ - ... 1 - ■ ■ 

t-2 在旧约*撤母耳记下”第二十四章中有关于 S 舶/口调 
查的最有趣的叙述 P A 耶和华又甸以色列人发怒贫:教动大卫％他吩 
咐人去數点以色刊人和犹太人”②*大卫就吩咐不愿意旳> 押 
( Joab> 去数点百姓以肆定有多少战士，.据记载,诨为大做 f 这 
—点，圣怒下降于以色列人，并有七万人死于瘟疫 6 、 : 

I • • ■ _ 

大卫王公元前十五世纪的那次人口调査和随之兩来的惩罚看 
来为后来群众反对人口调査提供了依据,纽约州长 Hunter 在1712 
年的报告 [2] 中说,“我对某些县和城发出命令，要求#报他扪居民 
和奴隶的数目，但是从未得郅完全的数宇，看来再轶砗上次虑数 

① 本节译文抄自中国基督教协会> 中国基瞀教三自爱国运动委员会印，斬 

H 南京19於年第157页， 一 译者注 . — ■ 

② 引号内译文抄 自中国 基督教协会_中国基#教三自 爱圃运 动委员会印，錡 W 
灼全,， .南京 ia & a 年第*03页.一苯者注 
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人 口后生 病所引起的一种无知的迷信和偏见使他们决心反对”① # 
考虑到早期的人口调査是征兵和收税的先兆，毫不奇怪会受到百 
姓的抗拒。 

t . s 英文人口调査 census 这个字来源于拉丁文 cemere * 
意指收税。罗马的人 P 调查是为罗马第六任国王 Servius Tullius 
<公元前534〜 378) 所创建 e 在这种制度下，由称为调査员 
( censors ) 的罗马官员编制一张登记表，记下五年问隔的人口和他 
们的财产，以便征税和抽壮丁 Dt ]. 在公元前5年，奥古斯塔斯 
大帝 （Caesar Augustus ) 把人口调查推广到全罗马帝国 & 这就是 

美丽的、传统的耶稣降生故事开头的诗句的来源： * 却说，在这些 
H 子里、奥古斯塔斯大帝颁诏书，全世界人民须纳税。”为了这次 
纳税登记,约瑟和玛丽去贝思尔汉姆 （ Bethleheni )， 耶稣就在那里 
诞生的 • 最后一次正规的罗马人口调查是在公元74年举行的。罗 
马帝国崩溃后，正规的定期人口调查在第十七世纪前一直没有在 
西方举行过 

1.4 英文统计 statistics 这个宇可追溯到拉丁文作状态或国 
家讲的 status ， 和作政治家讲的 statlsta 。 亚里士多德 (Adstotle 
公元前 3 84〜322>[5]生于马其顿 （ MacedoiU )， 就学于雅典的桕 
拉图，并在菲利普王的要求下当了亚历山大的教师。亚历山大继 
承王位时，亚里士多德在雅典创立起他自己的学派 e 亚里士多德 
的巧>!如^书中有1 5 8国家的插述。这种比较性描述158个画家的 
初步尝试后来由意大利和德国学者发展成一个学科，称为统计 (德 
文为 staatenkunde , 意义为国情学，英文为 statistics 》。 Wester - 
£ mrd [6：| 追溯描述国家的发展。 

①推自 E.B+ O’CallagliAfl 编 Doctrinfrnt$ Relative to the Colonial History of 
the Statt of HewYork* 第五卷， Parsons, 1S5S: 339 页 > 



1.5 在中世纪，虽然多次企图恢复全国性的人口调査，但封 
建制度多少使它成为不可能。一个著名的例子就是査拉曼 ( Chai - 
lemagne ) 大帝在公元 SOS 年的祈祷书。 

1085年的耶稣圣诞节时，威廉征服者下令对英格兰作一次统 
计调查。⑽中有这一调査的记录。调查收集了 
关于土地、地主、土地使用、佃户、仆人和牲畜的信息，在1522年一 
本新的 Domesday Book 完成以前，一直用作征税的依据。 

1.6 十六世纪早叶，伦敦开始出现死亡公报（公布死亡总 
数） * David [3] 追溯这些公报开始于克朗维尔 (Thomas Crom ¬ 
well ) 代亨利八世所发的一条命令。人们猜测国王之所以 W 要这 
些死亡总数是因为他对瘟疫有极大的恐惧。然而， Cassedy [2] 指 
出，这些公报的精确日期是不知道的，也很难定出它们是什么时候 
开始的，初开始的时候，死亡公报只记录死于瘟疫的死亡数。经过 
若干年后，扩充为包括受冼礼的人数，而到十六世纪末叶，还包括 
死于其他疾病的数据。 

1.7 西班牙人在南北美洲进行了最早的人口瀉査 4 秘鲁 
1548年的一次人口调査就是西班牙总督 Don Pedro de la Fasca 
作出的。 Carlos A*Uriarte 在 Estadisiica 1949 年三月份的那期 

中描述了这一人口调查，在西班牙人来以前，印加人有他们自己记 
尕统计数字的系统。这一系统用了交织起来的彩色线和结,称为结 
典记寧 o CassedyfS, 页 3] 引录了历史学家 William H*Prescott 

描述结绳记事系统是“半开化人民史册上罕有芄匹的一种方法。 
对全国所有的出生和死亡人数建立一本登记册， 实际人 口中的精 
确统计表就是用 结绳记 事每年向政府 r 拫”⑦ # 


①弓〖自 Handbook of StatUtic* (N 4 Y, Statistical Offic« of th« 

United Nations, 1 的 6, 页 0 
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i，》 在十七世纪的英格兰，人们对所谓的政治算术发生了 m 

大的兴趣。政治算术主要包含生、死记录的分析。在1662年， John 

Graunt 发表了他第一本也是唯一的一本很了不起的手稿，标题 
是 ^aiurat and Potifica ! Observations upon the Bills of Mortality 9 

尽管死亡公报中含有本质上不可靠的数据， GraiiW 对其中所含的 
信息作了详尽的研究，并发现许多规则性和不规则性。例如，生男 
孩的百分数几乎与生女孩的百分数一样，男孩的百分数略为髙一 
搜 * 这一观察在我们今天已是众所周知的.而在1662年却是一件 
新鲜而惊奇的事情。他曾对一段很长时期中受洗礼的男孩和女孩 
作了计数》计有男孩139, 7S2 和女骇130, 866， Gr aun t 作了坚决 

然而笨拙的尝试发展了为现在保险公司所用的那种类型的死亡率 
表。 

1,8 英文中 汾戒讲 ^ 这个词大约在十八世纪中叶由德国学 
者 Gottfried Achenwal! 所创造 6 当然，它是由作状态讲的 status 

和德文中政治箅术的对应体推导出来的，这个词第一次在大不列 
颠为 John Sinclair 爵士所用，他在 1791—1799 年所发表的一系 

列书卷中，根据不同教区的牧师们的通讯，对苏格兰作出了一个统 
计叙述 • Yid e [n 引 Sinclair 的话说， H 午多人第一次看见我用 
statistics 和 statistical 这两个新的词很为惊奇，可以设想，在我 
们自己的文字中，某些词可能会表示同样的意义”①，今日很难相 
信,在如此短的时闻以前， statistics 这个词竟会是一个新词。 

BoorstinCl] 指出 ， statistics 这个词在 1797年出现于 Enc ^- 
ctopaedia jBrUafmfci 他还指出 ja&ttefWcs 这个词有一时期在文 
学的使用上还是个竞争者，如果 publicistics 得胜的话，猜测一下 

事情的发展将是十分有趣的，是不是会有一个美国 Publicistks 学 
会， 或者一个皇家 Publicistics 学会？ 

①摘自 VuWp An Introduction to tht Theory of Statistics 第五版 1919( 第十 
五版， v uU 和 KeucfalU 郎 fl) 
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1,10 在美国宪法写成以后，人口调査赍成政府的一个正规 
而重要的部分。关于人拇查，宪法第二节箄一条规定如下，“实 
际的点数应在合众国:国会第 : r 次会议后 三年内 进行，并在以后十 
年一期 的时间内按照法律指示办理％美国第一次十年一期的人 

cjg 査是在 〗7 卯赞攀疗私涔哗每次的 A 口询査鄯是那次以后每. 
彘+年进行一次，除此之 S ， 在巍里领域中，调査是在更短的时间 
间隔 W 进行 • …” ^ 

■::■'■■ ■ ■ ■■ J J i I ^ ■- 1 IJ-I ■■. ' r ■■、 r 1 ■ 、 ： ■ i ; -■ 

在本演讲中，我们概述了几个人口调査数据的起源和 
这些数据的分析。统计这 一 f t 科,它的名字起源于状态的描述，已 
经扩展 到大大趙出这些原来 _ 界限，现代的政洽算术和状态的 
描述已构成统计的一个重要部分: _ 

I ■ I 

. .■ ■ . 

小结 statistics (统计)这个词来自 state (状态)，而状态的 
埤述构成了近代统 iF 的重要 根璩之 一。 皐癍 A 人□调*提供了国 
象和狄态的鉍芬描述，而这些人口调査是为了征兵和建立收税名 
舉, 旧约中可以找 到许奉 A 口 网査的例子，而新约一并鉍就叙述 
奥古斯塔斯大帝赛罗导帝辱举行的一次人口调査。 

:;律 H 和靠太科学者把状态的描述发展成为很接近于近代统计 
的一门学科。在威廉征服翥统治下，英格兰举行了一次详细的统 
计调査，并记录在 Domesday Book 0 在十七世纪的英褚当，政 

治 ■ 未盛行起来，'它主要包含生 t 死记录的分析,它提供了 某种早 

期的死亡隼*. - 

拜然统计这个，未身 直封巧 7 年第一 A 事于 
P^dta BntanmcQ ^牢固地建立应来，而矣国宪法&早就要 ▲作 
人口调查了， ^ 、 

■■ I L ■« J. 'I ■¥" I 

I | 

• • - r r • • ••- - - • 

d I _______ 、 • J : 
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习 题 

1 试对美国人 a 两查局所获得的统计信息作一摘要 

2. 试对依据美®人口调査局所提供的抽样而获得的统计信息，作一摘 

3. 1790年人 u 调査局所确定的美国人 a 有多少？ 

4. 除了本演讲中所讲到的几次人 a 调査外，试寻找圣经中所提到的其 
他各次 Aa 调柰。 

h . 试确定你的家乡是否有任何本乡的统计记录。 

6, 在没有统计描述的那些国家中，试找出它们有什么特征？ 

7 , 芡国的夕^^冰 + ^/』&卜(1<^对该国许多特征给出详细的信息，査 
阅迓近的一版，你能说出哪里是风最大的城?最热的城？日照*多的城？对 
你的 a 答，你®意附加什么说明么？ 

8, 用美国人口调进局所发表的1977年 Cbwiif 夕 and City Data Book r 

从你的州，取 '个十 个县的随机样本。只用县的数？，对州的失业百分数 
作一估计 & 你昀估计与州所公布的数字接近到什么程度？ 

3. 应用 Stathtical 的数据，对美:!从1950到现在的原曲生 

产璧作一张图， 

10- 为了解决人类面对的主要问题(饥饿，战争，原料的耗竭，疾病，污 
染，等等)， 你 能想出什么应该收集®视在汶有收集的统 H ■信息？ 



演讲2 


赌扬 

2.1 随机事 件缓慢 地进入 西方文 化。 杻会游戏早在纪元前 
几千年就被人们玩弄了,尽管教会方面对之渙烈反对 t 但却继续被 
玩弄直至纪元后的今天。然而明确提出随机事件的概念和后来的 
概 率理论是来得较迟的 * 某些历史学家把概率论的起始定在很近 
的公元1500年。 


2,2距骨 ( astragalus〉 是踝骨 (talus) 或后跟骨 <heelbone) 
之上的一根骨头。在上古和中古的文献中, astragalus (距 骨)， 
talus (裸骨 ），knuckUboM< 牛羊的避骨 >*hucklebon* (动物的醜 
骨〉 这四个字不加区分地被使用着> DavidC2* 3 ]给出早年机会游 
戏中使用距骨的有趣的和学术性的叙述。我们从考古文物中知道 
古代已收集了大量的距骨，特别是蹄趾动物的距骨 & 我们还知道 
这些骨头用在各种游戏中，如 David 所指出，距骨确实被用在埃 
及<公兀前3500 年代〉 的各种板盘游戏 (board games ) 中，在一 
种被发掘埃及坟墓者称为“腊犬和豺狼”的游戏中明显地看出使用 
距骨就象使用骰子一样，腊大和豺狼的移动步数是按照投掷距骨 
的结果。 David 还注意到荷马 （ Homer , 纪元前900 年代希腊诗 
人） 说过 PaUoctus 在玩距骨游戏时对他的对手狂怒，且几乎杀了 
他 《 


在罗马时代，游戏很盛行，政府为此定出阻止和约束的法律 # 
教会跟着起来坚决反对直至今日，但是尽管有这样多的反对 t 游戏 
和赌博却在各阶层人士中一直很盛行*在早年，大多数游戏用到.眠 
骨,而敗子和**后来才出现 * 


* 
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根据 David , 最早发现的骰子，其日期约在(公元前)第三个一 
千年的初始在伊拉克北部所发现的一颗骰子是烧制很好的淡 

， ■ a 

黄色陶器制成的，它两对面的点予依次是2和3, 4和5, 6和 J ， 
David 认为两对面点子之和为 7 的骰子出现于公元前1扣0年左 
右。 -'1 

机会设施 (chance mechanisms ) 除了用于游戒之夕卜,人们在 
各个时期还用它来猜测神的意志。 David 记录了许多这样的例 
子，并且很有趣地叙述最近时期所发生的一个实例6近在1737年, 

: folin Wesley 借助于抽签的办法以帮助他决定是否结婚。。 


2 3虽然提到机会游戏之处很多,时间也跨越数千年,概事 
的基本概念仅出现于最近几百年的文献之中。为什么概率的理论 


发風得如此之慢？在一篇有关概率论历史的文章中:， Kerfd ^ ll 提 
出选问题弁作了一个解释9他认为这是由于道德上和宗教上反对 
的缘故。看来当然可以相信教会的反对有神学上的含意而不是海 

于赌博的社会后果,然而 Kendall 所提出的解释有他个人的看 

法. 



①' 鼠 m Tar date fro"ii fde begi fining of* (lie tHirJ 

mUEeftniiim 后遗 . 了 j 二字母 * ■ 译者注、■■乂 1 I : ^ ^ 'l :、 
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H.Walfcer[8] 提到 Smith[6] 在他所给出的一个参考文献中 
曾谈及某些概率的思想早在公元前220年即已出现于中国文献 
里。 

Kendall 提请我们注意骰子游戏中计算槪率的一个早斯例 
子。 Wibold 主教在公元押0牢把56种品德的每一种对应、于掷 
三颗骰子的一个结果 * 掷三颗骰子共有56种可能的结果,这里我 
们不计较掷出的次序 (例如 2,2^1是看作与1，2,2—样的)4骰子 
掷出以后，投掷者就要化些时间专心致志于相应的品德(诚实^忠 
诚等)。 DaWd : 提到的中国作者朱世杰在1303年发表了二项系数 
的算术三角形，井描述它为一个古老的方法。他给出相似于图 U 
的图形 * 这一三角排列在今日称为巴 斯噶三.角 形，是在朱世杰之 
后351年由巴斯噶发表的 & 在以后好几次我们要甩到这一三角 
形，到那时再给出较全面的 解释 ， I 

a 

2. 4 数学书中*赌博问隳#早的一个例子出现于1494年在 
威尼斯印刷、教士 Luca Pacciolo 的著作 cSwmwi cfe arithmeiica f 
geometricalproporiioni efiroj ) orfiona ! iia >+ 0 他给出了当一个赌 

博在终了之前被干扰打断时，如何在参加的两个赌徒中公平地分 
摊赌注的问題。这是分点问题 (the problem of points ) 最早的 
一种解答* Walker 说这一问題几乎出现于以后出版的每^本槭 
率书中 

第一本包含概率方面宽广资料的书是 CardanoU ] 写的 
de lido a / tKf > D Cardano 大约在 15? G 年写这本书，那时 ft 在 Padui 

大学*然而书到1663年才发行 b 它除了作为赌博的一本手册外， 
还是用数学语言来表出随机事件输赢得失的最早例子的 - 个代 
表。虽然出现好多错误，但他解眛了许多问题，并把这些问题用十 
分类似于今日的语言叙述出来。 

有趣的是开普勒在一箄 发隶于 1606年的著作中(见 

• U 卜 



Todhunter[ ： 7, 页 4]) 对机会作了一些注释。那时他正在思索 1604 
年照耀得很亮的一 颗新® 出现的原因。 Todhunter 还提到伽利 
略在 1642 年发表的一份箸作中对概率作了一迚贡献9伽利略解决 
了一个涉及掷三颗骰子的问题。他证明了在216次可能情况中， 
掷出10点有27次，掷出9点有25次 # 

2*«概率方面下一个有记录的主要工作是在巴斯噶 <Blaise 
Pascal ) 和费尔玛 (Pierre de Fermat ) 两人之间的书信中，巴斯嘴 
和费尔玛是当时最出名的两位数学家，巴斯噶<1623〜1662>在他 
25岁时就建立了物理学家和数学家持久的名声，然而从那时起他 
却退居于一种宗教沉默的生活之中。费尔玛 (16 1665〉在数论 
中陈述了好几个著名的命题。不计过去所提出的 
…些小的提示，概率论可以说真正开始于 E 斯噶和费尔玛;并且恐 
怕很难再找出两个人能承受更高的荣誉”[7] # 

De Mere 勇士的出名是由于他所提出的问题开始了巴斯噶 
-费尔玛的书信，虽然我们对 de Mere 的身世几乎一无所知， 
David 说，6斯噶和 de Mere 如何讨论这些问题的，没有任伺记 
载，但可以认为他们的接触是在巴斯噶的所渭放荡时期因为 de 
Mere 不是 Mersenae 学院后继组织的一个成员，他们的遇见很 

可能是在非学院的环境中”[ 3 ]。常见的推测是勇士所提出的问巧 
是由于他偶尔去赌场的缘故 * 大家知道，分点问題是 de Mere [fij 
巴斯噶提出的，设一个赌徒用一颗骰子要在八次投掷中掷出一个 
六点。他在开始的三次投掷中都没有成功，如果他放弃第四次投 
掷*那么赌注中有多大一部分应归于他呢？关于这一个和其他的 
点子问题，巴斯噶和费尔玛通了很多信札。 

在那个时期的各种骰子问题中还有一个如下。赌场提出愿以 
一对一的赌注与掷一颗骰子四次至少获得一个六点的人打赌。据 
说 de Mere 感兴趣的是一个较复杂的问题 6 假设投掷两颗骰子， 

那时的想法争辩说，由于掷两颗骰子的结果六倍于掷一颗骰子，那 



么掷两颗骰子 24(6 X 4> 次至少出现一对六点应是对赌场存利的 P 

有人相信 de Mere <当然在赌场里）已获得经验论证在 N 次中输 

赢机会是对赌场不利的。巴斯噶证明至少有一对六点的概率事实 
上足，491。 

巴斯噶-费尔玛书信中另一项目是以前提过的算术三角形 t 
虽然巴斯噶是这一三角形的一长串发明家中最后的一个，而有趣 
的是,这一三角形却广泛地称为巴斯噶三角形。 

2*7 由十七世纪到现在,概率论的发展巳远远超出与机会游 
戏打交道的简单起源。这些年的经历是出人意外地丰富多彩，而 
我们将用几个片段来结柬这次潇讲。经历包栝莱布尼茨 （ Leib - 
niU > 于1666年发表的著作，其中给出一个类似于算术三角形的 
表。他用一个很奇怪的符号。从一组事物中，一次取两个，他用 
com 2 uatio ①；一次取三个， Com 3 natioj 一 次取四个 Coin 4 natioj 

余类推 & 莱布尼茨按现代的意义使用+,_,=。他用 u 和 n 来表 

示乘和除，而这两个符号在现代集合论中代表交和并,奇怪的是他 
用积这个宇来表示和，如8是5 +3的积。 

在作者詹姆斯，贝努里 (James Bernoulli (1654 〜 1705>> 死 
后于1713年发表的以 Oiiedcwirfb 书中有算术三角形的另一 

形式。这一著作在许多方面是非常重要的。贝努里坚决主张概率 
对民 liK 道德和经济都有应用。这就有待于后来者去寻找应用了。 

在1733年十一月十二日发表且只分送给友人的一篇文章中， 
德莫哇佛 （de Moivre ) 给出了著名的正态 曲线。 Wallcer [8] 指 
出 ，正态 曲线的这一起源屉皮尔逊 （Pea r so y 发现的。 

在17世纪后期和 M 世纪早期，那时美国还处于婴儿时期，正 
态曲线已 被大数学家拉齊拉斯和高斯牢固地树立起来。高斯在分 
析天文数据中应用了正态曲线。奇怪的是，正态曲线广泛地被称 


①这 ' A 释为组合的拉 ] 文 combinahctiem 和致扮合起来⑴一个符 s. 
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为离斯曲线或分布 * 

槪率将应用于人类活动的许多领域中的这一贝努里信念已被 
证实 e 今后要做的许多工作无疑是远离赌场的，而赌博的起源依 
旧是这一学科的一个生动而有趣的部分。 

小结人们玩弄机会游戏从公元前几千年起到现在 4 人们利 
用各种机会设施，而最早的一种是投掷称为距骨的磨光骨头骰 
子和纸牌很迟以后才出现。 

虽然机会游戏和机会设施早已被人知晓，足眵完整的概率理 
论邛不存在。直到十七世纪中叶，学科的真正发展尚未开始当 
然在 很早以 前就可找到这一学科的某些痕迹，但概率的发展作为 
—个严廁的学科在西方世界是从 E 斯噶和费尔玛开始的。他们的 
著作专 门致力于睹博问睡，把概率引向正路。 

有了诸如十八世纪的贝努里和德奠哇佛 t 十九世纪的高斯和 
拉普拉期等人的贡献，概率论已作好准备来迎接十九世纪末叶开 
始统计发展的洪流。… 
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1. 写一篇短文关于概率的赌博 起嫡。 大多数的百科全书含有可以帮助 
你的资料。 

2. 试寻找巴斯噶三角 f 各行产年的规珣。： 

3. 投掷两颗骰子 24 次，并记录十双六点出现的次数，重复这一操作 

20 次并记下至少 出现一 个六点的次数。是否这一绾罘与 G 斯喝的绾罘合理 
地相一致。 … ： 

4. —个狂欢节游戏提供五元奖金，如果你：连投掷二颗般#全次而能至 

少得到一个六点，问你愿意出多少钱来得到一次参加的机会 t 你觉 得你苽 
的机会是什么？掷了一次而抆有得到六点以后的机会？掷 f 两而我有得 
到一个六点的机会 t … d ::: 

' 5,两个女同学达业后在一次校友会上邁见时同磨玩下列游戏，错包内 

谁的钱较少就把她的钱全部输给另一人^每个人都在想，“如果我失贼 7 我 
输的钱要比我如果获胜而贏的来得少％问这种想_的错误间#? 

6. —家杂志为了推广销路而举行一次100,000元 A 抽比赛。有 
累的入都有麻得100,0⑽元大奖的机会4如果中奖的机会是1 

是否值得化费邮资去取得参加的权利？ 、: 

7. 一个职业睹徒想要有一对灌过铅的骰子，他‘甩一位技工为他造二 

对骰子使掷得两个一点的概率恰好是 U 分之一而不是 36 杏之4他被杳知 
每种可能的计算都已做过并且所需要的概率没有疑问是 1/64, 于是他付了 
找工_劳*然而散子并没有掷过，祢会栴痦技工的话吗？ "- ■ ^ 



演讲 3 

科学家 

3,1 在 1969 年的舂天，在 Johns Hopkins 大学举行一系列 
共三次的演讲讨论一个古老的课题——观察与理论之间的关系 
[2]。那一次 Ernest Nagel 讲的题目是“理论和 观察' 他一开始說 
讨论爱因斯坦关于科学中滨绎和经验这两个对立部分的观点。 
Nagel 引用爱因斯坦的话说……纯逻辑的思维不可能告诉我们 
任何经验世界的知识；现实世界的一切知识是始于经验并且终于 
经验。 

科学理论就其对观察的矢系而表现的逻辑地位受到科学家和 
哲学家的关注已有好几个世纪了，按 m 我的观点，现代统计帮助 m 
观察和理论联系起来，因此是科学思维的一个重要的组成部分。然 
而，基于统计理论的统计方法只存在大约一百年。在本讲中，我想 
讲儿个在科学中有关统计发展的人和思想， 

3*2 在 1620年培根 （Francis Bacon ) 发表了 Novmt Orga- 

_， 在这—重要文件中，培极对科学方法发表某些看法，虽然他 
没有实验室中的直接经验，培根得出结论说，我们只能通过观察学 
到东西 • “人，作为大自然的管理者和阐明者,能做的和能理解的， 
同他对有关事物或思想的自然规律的观察所允许的一样多，不可 
能多懂些也不可能会多做些页 37 X 他建议通过收集各种可 
能的数据并做每一能想到的实验来考察宇宙的一切方面。然后把 
数据排列成表再进行分析。培根所建议的这样一件详尽无遗的工 
作，虽然看来朴素，却表示对经验方法的一个重耍的支持。 

从科学最早开始时起，当然，数据 已被 分析和押解 u 然而这并 
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不与我们称为今日的统计相似，直到十九世纪概率和政治算术这 
两个概念开始结合在一起才有今日的统计 t 

t 

S .3 早在1783年，拉普拉斯就建议正态曲线方程是适合于 
表示误差分布的概率 。 K 3.1 给出这一曲线* 

m 



正态概本曲线 

如在演讲2中所指出，这一曲线是德 * 莫哇佛于1733年在一 
篇未被人知的文章中导出的，而这篇文聿在1924年被 K •皮尔逊发 
现。在1809年髙斯发表了他的天体运行论的伟大著作 [ i ] Q 在这 
一著作的第二卷第三节中，他导出正态曲线适宜于表示误差规律, 
同时承认拉普拉斯较早的推导。基本思想是 t 如果观察误差是由许 
多小的、独立的误差相加组成的，正误差与负误差同样的可能，并 
且集中点靠近零，如图3_1. 

有了高斯和拉普拉斯对正态概率曲线的应用，概率论在几乎 
—切领域的科学尝试中开始稳步地走上应用的道路*奴努里对概 
率论能有应用的信念开始得到证实。 

伟大的比利时数学家和天文学家 Adolph Quet « iet (1796— 
1874>,把正态曲线从观察误差推广到各种数据,他在社会科学中 
为开发统计迈出了一大步 • 他注意到，如果大童人的高度画成一 
张柱形图，这张图很象正态曲线从而他开创了社会统计学这个 
学科 • 虽然 Quehlet 最著名的成就是通德统计学 (moral sta tis - 
tics ), 就是他对心理事实、社会事实和风俗习愤进行数量化的 
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:努力，他认识到这个新生学科的广泛性。 WalkerCS , 页 41] 注意 
到 Queulet 在1841 年 荇向英联邦统计学会榫供不庄 4 0个应该 
用统计方法來研究的课题。 

^ Quetelet 许多理论中#使人感兴趣的 -r 个是* 通人论 (tlieo- 
O' of average man), 显然,他觉得普通人，如果存在的话 y 伐表 
一切都是美好的4 

3,4 在十九世纪的后半，家^在遗传律的研究上起了主要 
的诈用。达尔文从海归来后，在1859年发表了《物 
种起源》 (The Origin of Species) c 这厂著作对许多伟大的思想 
家有深远的影响。 . 

在奥地利的 Silesia 〈现在属捷克斯洛伐克)，盂德尔 (Gregor 
Madel> 在1^53年七月作为一个代课教师回到 Brno, USG 年 
他开始了对可吃豌豆 (Ai 帅&此脚>的实验，这十，工作 -- 直继 
续到 1S 似年 t 孟镡尔发稞遗传规律是一种流计规律。他选择七个 
齊变异的豌豆時征！子的形状，子的颜色，豆英的形状，豆荚外衣 
¥颜色，孝成熟 S 荚的颜色，花的位置和豆梗的长度，盂德尔把绿 
色豌豆与菁色豌豆杂衮,结果，下—代全是黄的。对其他六种特征 
的每一种，他得到相似的结果。豌豆新的一代总是象它 g 母本中 
的—个。 

；:从混合的父毋本的黄色豌豆中培养出来的第二代，大约四分 
之三的琬豆是黄的，其余最绿的， Sootia[ 5 ：l 记下盂德尔的数据 

如下， . : .... 



黄色子对绿色子的比网 

M 



与比例^ G 的相符牲是惊人的，盂襌尔的其他六种特征的数据存 
在着类_惊人相符性 t 


言 
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盅德尔把他的工作提交给 ■■136 &年在 Brno 召汙的自然科学 
联合会的两次会议上，并把成果于 1S66 年发 表在一篇文敢中 # 奇 
; 怪的是，他的工作没有受人注意，或者被人忽视，直到 1900 年才被 
人重新发现。 3:1 的比例是下列简单解释的结果。飩黄的和纯録 
的豌豆有两个特征 

纯黄的 YY 
纯绿的 feg 

当这两种豌豆杂交时,就有从每一神中选取一个特 征的陆 桃选象 
于是在第一代 ( F ,> 中得到 Yg 6 当 F t 代的杂交豌豆再次杂交时， 
就有从每一亲本中选取一个特征的随租选择，在第二代 中得 
到如下的结果 ： P 二:: 


YY Yg gY gg 



孟德尔就是这样得到1:2:1比例的。在一种特诳比另一种特征处 
于 * 梃桂状的情况时，如黄的比绿的处于显性性拔財，观察比例就 


是3:1, 


盂德尔把他的研究进行到第三代，伹我们将不去讨■论它1从 
今天的观点来看，很难体会他的思想的伟大。但盅徳尔不是_: 
一观点进行思考的。他的思想，现在看来是如此地徇单，然而却可 
以排在历史上真正伟大思想的行列之中 。 Robert Olby 在他著 
作〜响 of iWhrf 说 mO ] 的律者注中摘引了英国广播公司的一 
次广播说“常常象半顿所说的，继承者能比先驱者们看得远一些， 
因为站在先驱者的肩膀上，当然比先驱者看得远一些。但对盂德 
尔却不能这么说，因为他根本没有先驱者的肩膀好站，' 

在英格兰/迖尔文的工作对他的表兄弟，髙尔登爵士 ,（Sir 
Francis GaU on > 有深遍的 影响。 对研究进化论，高 i 尔登比达尔文 

有更好的数学修养，他发表了许多有关遗传学的论文和书。1869 
年出呢了 Hereditary Genius 1889年的 Natural Inheritance, 

高尔登是便矣 fea 归这两个非常 重要靖 食的第 一 X ,它们将 
在以后的演讲中讨论 • 
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现在确信高尔登是知道盂德尔比例 1*2:1 的，并把这一比 H 
在1875的一封信中转告达尔文。高尔登认为巴斯噶三角形足求 
得这一比例的一种方法（三角形的第二行是1;2:1)。但看来达尔 
文或高尔登都不体会这一比例的重荽性* 

3.5 皮尔逊在伦設的大学学院 （University Collep ) 在 
1890年代由于高尔登//冰的激发，邗始把数学和 

概率论应用于达尔文式进化论，从而开创了现代统计的时代。在 
1901年 Biometrika 的第一期出版，这是致力于粑数学应用于生物 

学的一本杂志;皮尔逊是它的一位 编辑， 

在二十世纪，统计的发展已远远超出1901年的范围，并被证 
实在科学尝试的一切领域中都有用。 

小结 实狳科 学的起源过去一直是模糊不清的。在十七世纪 
以前仅发现很少几个痕迹 * 1620年培根论证说人只能迎过观察来 
学习。在十八、十九世纪，实验科学迅速发展，科学家们开始利用 
那时存在的槪率论。 

在十九世纪，* 斯和拉普拉斯 对正态曲线作了大量的应用，后 
来伟大的比利时天文学家 Quetlet 也做了很多应用。 

在18郎到1郎 3 年之间， 孟徳尔 从一个不朽的科学实验中发 
现了造传学的 统计*律， 从而建 立了孟德尔式遢传学 的基础。玆 
无前例,盂德尔洞察到遗传机理就象一个随机设施在运行。 

在菸格兰， 离尔登受了达午 女工作的影响 t 对生物计量学 
(Biometry) 的基 础做了 重要的贡献，接下来， 皮尔逊受高 尔登工 
作的重大影响，纟5过一生的努力，廉得 了统计之父的 称号， 
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习 题 

i * 看一看你主修领域内的教科书和杂志有哪些用到正态 

找一篇描述科学方法的文章，你感到在科学方法的哪.阶 asm 到 

統讦？ 

3. 查阅达尔文的<物种起源达尔文有无用过任何统计 论证？ 

4. 进化论依据统计资料到什么程度？ 

5* 在你所读过的理科课程(中学的和大学的>中，有无任何科学理论严 
格依据理论的推理而不作观察的?你能肯定吗？ 

^ 用投掷一对硬币（比如一个二角五分的， 一 个五分的美国硬币）来痍 
拟孟德尔的豌豆实脸，设两 个硬币 的图形面对应 YY , 二角五分硬币的图形 
面和五分硬吊 的文字 面对应 Y & 二角五分硬币的文孝面 T : 彳五分硬币的图形 
面对应 gY ， 并设两个硬币的文字面对应 S g ， 投掷这一对硯币1⑽次，并 

记下 YY ， Yg, gY 和 gg 出现的次数，你的结果是否合理地符合 

例？ 


7 . 把培养豌 H 实验的理论进行到第三代，把 Fi 代的… 颗黄色豌豆与 
F , 代的一颗绿色敢亘杂交，黄色豌 H 与绿色豌豆的比例应该是什么 t 




的描述 




演讲4 


总体和样本 

n 

4_ 1 1693年 Edmund Halky 依据 Breslau 城的死亡数据， 

发表 了 “人口 死亡”表。在十九 Joli n B en n La ms 应用 
Rothamsted 五块田地上小麦产 it 的 年记录以估计 1 S 52- U 79 
年间全英格兰和威尔士每英亩产量的变异。这些和其他早期抽样 
的词子可在 SU P li a ti [7： l 中查到 ^个体的 集合称为总馋，总谇的一 
部分称为样本。这些例子说明如何从样本的观察来对总休作出推 
断的思想，总体可以是楦物的、昆虫的、岩石的、宇的、书的、实验 
室 ㈣ 亞数剋的、人口的等等。在大多数情况中，总体的每一成员 
联系一个数。统计学家惑兴趣的常是与原来总体相联系的那个数 
的总体。 

总体与样本的区别是统计最基本概念之一，指出这一 E 别是 
十九世纪以来大多数统计理论和方法论的基础任务 t 在统计早期 
成较的岁月中很难弄洁这一简单区别；对今日不谨懷的学生仍会 
带來无泳止的困难。统计的极大部分涉及到妁何揋据来 S -一个总 
择的一个祥本对镔总你作出推断。很关键的是弄清这 一 E 别， 

4*2 在十九世纪终了时 f 皮尔逊 （Pearson 1357〜] 936) 和 
妝的劭手们应用统计方法于迸化、遗传和有笼领域内各式咨纪的 
问题。通过他们的工作，数学概率与统计变成密切联系起来。他 
们很大一部分工作涉及总体的数学描述，那时他们称总体为宇宙 
或集体。虽然皮尔逊的某些工作是必须与样本打交道的，样本和 
总体的区別并不总是很清楚。在二十世纪头几年中，这二者的区 
分变得好一点 * Yule 在他 mo 年发行的教科书 [9] 中指出这一区 
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4.3 费希尔 ( Fl s heO [2] 在 1922 年发表的一篇 踅 要论文 [On 
the Mathematical Foundation of Theoretical 

说明总体与样本之间的联系和区别 6 他说统计学中的问题可以分 
成 三类： 

1* « 格问题这是关于选择 概率分 布以描述总体的问题4 

2. 估计问题这些问題涉及由样本中算出一些赀，称为统计 
置，以代表总#:中称为参数的一狴量^ 

3. 分布问题这些问题涉及统计置的分布，并将从演汫 13 起 
到书末为止较详细地讨论。 

当然还有其他的统计问题。例如这里的分类所没有包括的一 
个主要问题是实验设计 & 这将在演讲28〜30中作一定长度的讨 

论， 

4*4 在以后的演讲中将引入一定数量的符号。为了保持样 
本中!15量与总体中相应量的区别，我们采甩下列早已建立且广为 
流传的惯例。 妁属 可能，用希腊字母记总体的量，用罗马字母记样 
本的 ffi . 这栉做将会使学生们避免混淆。 

4.5 在许多学科中总存在一个规范向题或者一个标准形式 
㈣ ^ 它很筒单，但为思考提供一个依据并可作 为发展 较犮杂思 
想方法的一个基础。每当我们从一个明确而存在的总怵中取®— 
个涎机样本 f 就遇到一个我们愿意考虑的规范情况。我们想要做 
的 A 由样本中得出总体的某些特性 & 我们要指出三点。 

总体是一个客观存在的总体（例如本书中全体句子枸成的 
一个总体 

祥本是一个随机样本（即将给出 定义〉 ，而不是一个代表性 
样一（锕如由全体句子的总体中随机地抽取10句 ） a 
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3. 我们感兴趣的总体特性可能是每一句的平均宇数， m < if t 
只有 —个样本,我们必须由此样本得出我们的结论。 

我们现在要对2, a 两点作较详细的注释，对许多人来说，他 
们有一神根深蒂固的感觉，样本必须是总体的代表——就是它必 
须是总体的一个雏形。略一思索便知这是不可能的，一个8人的样 
本无论如何不会“象*一个2000人的总体,在一个样本中我们霜要 
与总体对年龄、性别、民族、教育、收入等有相同比例的表示。我们 
坷能*定选择 4 个人小于 30 岁， 4 个人大于 30 岁。然后对每个 4 
人小组中，可能选两个男的，两个女的。对4个2人小组的每一 
组，可能选一个黑人和一个白人，要考虑总体的任何其他特征，势 
必要求把人分成小块，尽管代表性样本的思想很有吸引力，然而却 
没有汶证明是一个可行的概念 * 看来还无法给出代表性的一个客 
观定义。 

现在广为接受的想法是随机地选择样本的想法6这并不意昧 
着杂乱无章迚受到调查人员幻想和偏见的影响 o —个随机样本逛 
如此选择的一个样本，使得具有相同个数观察值的每一可能的样 
本都苕同等的机会被选着 

随杌样本的定义有时被认为是 John Verm 和 C . S . Peirce 所 
提出 （ Carnap , [1， pp + 493 〜494])。虽然 Venri 很详细地讨论 
了随沉性，但他并没有明确地提出过随机样本^恰好相反 ， Peirce 
的蓊作中充满了随机样本的各种定义，比如， Peir C e [5] 说“一个样 
本足随机的，如果用这样一种机器来抽取，不论机®是人造的还是 
生班的，长久下来，整批中任一个体将会象任何其他个体同样频繁 
地被汕到”。 

甴样本作出哭于总体结论的过程称为统计推断 e 在以后的淡 
讲中将会遇到三个主要的推断领域。 

K 由样本中计算出称为估计的数，用来作为总体中称为参® 
的常数之值 e 

2-对我们的诂计计算出确定性(或不确定性>的区间。 
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3. 应用统计拴验来判断样本信息支持总体参数的理想值到 
什么裎噔。 

Pe 〖 rce 清楚地理解在作 出有关 总体的推断时样本所起的作 
用 & 随机样本的定义是取自标題为“由样本的推理 # 那一节 ， Pdrce 
说“归纳推理, 其实， 就是从一个随机取得的样本对样本所柰 Q 的 
整体作出 m 断， 

4*6 一 a 决定要选取一个随机样本，如何实现，却不造一个 
简单问题。从概念上來说，完成它的一个最简单方法是绐每一个 
休标上一个号玛，把这些号码写在纸条上放在一个斗内，揽匀后从 
中抽出呰千纸条，许多其他方法都是一样的。但有一种方法用了 
约50年，这就造使用随机教表，它不需要什么设备如装往斗內的纸 
条或放在坛内标上数字的球，只要查一张随汍鉸码的丧，读出所浮 
要个数的数 码字 ，并选取相应的个体作为样本， 

Tippett 在 1927 年编” 了苐一张随 钪数衷 [8]， 它是从英岱兰 
税收; 2 录中摘下一些数码宇而行到的 & Hald [4] 从1948年丹 安間 

位中奖数宇中提出了 .15000 数码字。 Fisher 和 Yates 
I ： 3 ]从、英闷对数丧 》 中提出 苐 15 个和第 19 个發码宁而筠^成一 
铱隨泣数表，最大的随机紋说是: Corporation [6： a ：!；<!®, 
它杏一 TT 万个数码字& 

衷 A . I 是由 Hald 的丧中摘出 fft , 你们将会注 S 到 Q 码竽中 
约有十分之一力零，十分之一为1,十分之一为2,等等.你们还将 
会注意到这迚数码字是合理地混合得很 好的。 

常常有人反对说“记彔在一个表上的数宇无讼如何不能®随 
机的' 或者说 * 数字写下来以后就不能是隨 机的' 有两点应 K 强 
调， 

1. 一个随机数表不是隨机的，但 可用来 棋拟或近似一种随机 
设施 的应用 & 

2 . 我们不一定愿意把从一种随机设施所获得 的结果 记录下 
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来作为随机数。例如，旋转一个轮子恪到一连串一千个零完全是 
可能的，但我们不会在我们的表上记下一连串一千个琴 * 

这些意见可能需要经过一些思索才能挨受 * 为什么从一张对 
斂表上摘下的数码字会比从一种随机设施所得出的结果更能被接 
受作为一个随机数表？关键是在应用一张随机数表时，我们对表 
的输出比对表的来源更为关切。我们用这个表来模拟一种随机设 
施的使用而不是一种随机设施的记录结果 & 

4*7 我们讨论了从一个存在的总体拙取一个随机样本的规 
范情况，这对数据提供一个十分有 m 的思考方法，从而插动科学的 
发展。然而，样本常常是真的而总体只是概念性的 t 我们可能投 
掷一枚钱币50次而得到30次图朝上，这50次代表一个来自包栝 
一切可能投掷的概念性总体的随机样本。类似的情况也常常出现 
于实验科学中。假设我们要比较两种新药 A 和 B 的解痛效果。我 
们选了別个受试者，并指定 A 给25人， B 给另外25人。我们的样 
本包含这 S 0 个受试者，总体是什么呢？总体可能是很大一群的人， 
一半 HIA , —半用 B , 但是，事实上,这样的总体并不存在，而是 
被实验者所设想的一个总体，它只能在我们50个受试者是它的一 
个样本时才能存在 * 

I 

4_8 另一种偏离规范的情况出现于当总体是真的或者概念 
性的，但是没有 明确地 指明，例如，假设一个经济学家观看过去 70 
年的物价数据。她可能把这70年的物价数据着成来自某个总体的 
—个随机样本，这个总体必然不会明确地指明（实际上，这些数据 
称为时间数列）。 一 

当你继续你的统计研究，更多的困难将会产生 p 如果你坚持 
区分总体和样本，某些困难是可以克服的。 

小结在早期的文献中可以找到由某个总体中抽祥的明确钶 
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子，然而从总体中只能取得祥本的认识常常是缺乏的。到13世纪 
末,对样本和总体的区别已晋遍知道,然而这种 K 分并没有一直被 
堅持> 

在1900年代的早期,区分变得更清楚了，并在1922年被费讀 
尔特别强调。遵循着费希尔，应用来自总体的一个晡机样本来处 
理对总体作出推断这个问题的统计理论和方法发展起来了 4 

为了给随机抽样理论提供方法，就需要一个随机设施，或随机 
设施的一个模拟者 * 随机数表提供了一个十分方便的模故者。 

有了来自总体的一个随机样本，统计理论就是要对参»作出 
佑计，计算不确定性的 E 间，弁做统计检验。 

最后,统计理论也处理这样的情况,其中总体没有被很好地定 
义或甚至于是撅念性的， 


参考文献 

1 i Carttapi Rttdo'pli .(1963) Logical Foundction of Pfobability P Chicago* The 

Uutver$if7 o Chicago Prcssn 

2 - Fisber, R.A,(1922) “On the diii o：i of Theoretical Statistics, M Philcso* 
phical Transactions ff the Royal Soctely, A-222, 309-36ft r 

3. Fisher* R*A. and Frank Yates. (1963) Statistical T^bl^s for BiologUal* 
AgricuUuraL and Medicat Research^ 6th Edition, Edinburg t Oliver & 
BoytK 

4. Hald, A + (IB&2) Ststii ； icat Tablet and Formula, New Kk: Wiley. 

5. Peirce, C,S. (l^BB)Ccltect£d Papers of Charles Senders Peirc^^tdiitd by 
A + Bur^s j Cambridge, M&ss t Harvard Universit/ Preis* 

• . Rand Corporat^n. (^955) A Miltion Random Digits with lQ0 P {)a0 Normal 
Deviates ， Glencoe, Ill.* Free Press. 

7 - Stephen, Fr«d«rick F, (l948) rf Hls!ory of the Use^of Modern Sampling PiOw 
dti«s, w Journal of the American Statistical Association^ 43 r 12-39* 

8* Tippett, L + H.C. (1927) Roadom Sampling N umbers 4 Tracts for Comj n- 
tcrs 3 Vo1 ， l5 ， Cambridge ， England ： Cacil>r3dg* University Press* 

♦， Ytile> G* Udny. An Introduction ia the Theory of Sth 

Edition (1st EdUion, IS10)* Lf>ii(5oD ； Cliarles Griffin, 


聲 


3« 


4 



习 题 

1. 考虑演讲4中句子的总体，幷设你关心的是句子的长度，.你将怎样 
选择一个10句句了的随机样本？ 

你会认为攻读这一课程的学生是这个大学学生的一个随机样本 

为 卄么？ 

3+应用表 AM , 从一个含有等比例数的数字00, 01, 02，…，&9的 

总体中抽取一个两位数字的随机样本，试按照下列方式选取你的帘本， 
t 把一支铅笔“随机地放在这一页作为出 发点。 1 

b , 预先决定数字是按水平、对角线、铅直等方向读下去 * 

c . 由出发点开始并按照 b 中决定旳方式读出两位数字（不理会表上的 
空档)。 

你的样本是否看来合理？ 

A . 査阅你们®书馆中的统计书籍看能否找到除这一节中所提到的其他 
随机数表。 

5. 并不是有资格选举的人都参加选举> 参加选 举的人构成总体的一个 
样本 * 

a . 把参加选举的人着作总体的一个随机样本是否合理？ 

b . 为么当参加选举的人很少时，选前的民意测验十分可疑？ 

6* 应用表抽取一个含有10个不同的 H 位数的随机样本 r 用这10个 
数作为本书的页号。 

»,在什么方面，样本页号与整本书相似 t 

b . 在 ff 么方面，它们明显地不同？ 

c . 应用样本页号以估计本书中习飪那…部分所 A 的比 例。 

7. 本地区的气象预报常常给出下雨的础率以表示某种妆况的随机性， 
本地区过去一年中的日降雨 置是某 个总体的一个样本。这个总体是什么？ 

5-电视上报导小规摸意见调査时常附有声明，这些结果可能不太利学 
——它们仅仅是意见中的一个随机抽样 * 被问到意见的是剐要离开一家专 
门供应男子用品的商店的前10 个人 • 

B . 被铀样的是怎样一个总体？ 
t >, 样本随机喝？ 

C . 对怎样一个总体，这个样本可以看作一个随机样本 T 


4 
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频数分布和理论曲线 

5,1历第一卷一开头的一篇社论中有下列的 陈述* 
要使任柯自然选择过程在一个人秤或物种中起作用，第一个 
必要条件是在它的成员中存在着差异，而要 探索一 个选择过程吋 
人种的任一特缸产生什么可能的影响，第一步必须对这样約成员 
出 現的頰 教作出估计，这种成员对该#征而言呈现茱种程反的反 
常性 # 

这样强调頻®分布是这个时期科学文献的特点，而这个时期 
的科学文献是充满着各种数据的频数分布 • 

5*2 在 18 叩年 BortktewiczC 13 给出每一骑兵队中一年甲 

被马踢死人数的频数分布 〈见表 5.1) 0 早沏的各期中 

有许多类似的表，比如罪泥的年龄，脑子的容量，花的粵片数等等。 

Latter [4] 给出有关杜鹃蛋大小的频数分布 # 

■ 

査阅近代科研杂志也会见到数据来源极为不同的频数分布 ♦ 
Maddi [5] 给出首席法宵们对一组律师的评分,见表5.3。 

表被马场死的人数 

(每队毎年） 





表 5,4 中的数据是 Kj e t Saa [ 3 ： l 在研究《静静的顿河> 的作者 
是谁的文章中给出的。数据给出三本书中每一千个字里所用的不 
同的宇的个数,这里两本书的作者是已知的，一本的作者 m 是那个 
有争议的，歎据证明在 Kryukov 和肖洛霍夫两人之中更象是肖 
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5.3 考虑表 5,2* —个蛋的尺寸恰好是1475,那么它应该 
箅在 ： Ud 5 〜 14*75 组内还是算在14, 75 〜15.25组内呢？ 某搜教 

科书采取烦琐的方法来回答这个问题。并无必翌使事情 K 杂化》 


良径（吋）1620^1650 1650^1680 16&0 〜1710 1710^1750 1750〜1790 


5.5 斗杷上孔的直技和年代（百分数） [2] 



抽样的字焱 


不同的字 


洛霍夫所写的。特别令人感兴趣的是，肖洛霍夫就是由于这本《静 
静的顿河>而获得1965年诺贝尔文学奖的，细节请参阅 Kjetsaa 
的文章6 

英国陶土烟斗常为研究历史遗址的学者们提供有价值的线 
索。 aw 年 Harrington 编制一张图把斗柄上孔的直径与烟斗的 
年代联系起来。表 5.5 中所示的是 Hun ! e [2] 所给出的数据，由这 
个表可以见到测量小孔的直径将对确定一烟斗碎块的年代是有帮 
助的。 

表 5-4 * 静靜的桢河，冇争议的作者 [3 J 
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必要的是把它搞清楚。我们可以采取这样一个规定， U .25 〜 U .75 
组是到达而不包括14.75, 14*75 〜 15.25 组是到达而不包括 
15.25, 等等4不论采用什么规定，提供数据的人必须把它讲清 
楚。另外一个方法如表 5.2 所暗萊的是解决两组之间的边界问 
題，如果$度足量到圾近的半时，组是如此选择使一 个度纛 不可能 
恰好落在^界上。 

在表53和表心4的数据中不产生这类的问题。这些表中的 
度量 是离散 度量的例子。不论你如何仔细地点数，所能得到的度 
量只会是0,1,2,3,4,…。与此相对比 t 表5_2， 5.3 和 5*5 中可能 

的度量依赖于度量得多么精细*因而它们称为连续度量。 

5.4 当我们对连续数据构造一个频数分布时，常要求把数据 
合并起来分成组*合并可以对离放数据和连续数据一样做，而频 
数分布的外貌依赖于组的个数。 

我们可以不把数值的频数列于组内而枭记下相对頻數 （频数 
被总观察数除>。另一个方法是记下百分数〈相对频数乘以 100) 
如表 

5,5 把离散频数分布描绘成如图 5.1 的图常是有益的。这 
里点的高度代表由表5 + 1.中得来的相对频数。对连续数据，用一 
直方图描绘频薮分布常更有益。这里相对频数以面积来表示，而 
f ( x ) 是相对频数乘上一个合适的因子使总面积为 u 这可用根据 
表 5 *2中数据绘成的图 5.2 来说明 & 每一组的中点称为组标，在 
用直方图作计箅时，组标代表所有 M 于该组之值。 

5-6 近年来群众都见过由 “ i 卜算机技术深化 # 过的地球、月 
亮、木星、火 M 和金星的照片。虽然整个过程是很深奥的，但其中 
某些基本概念却可用本章的一些初等槪念来 叙述。 Scollar [8] 把 
深化砟的图皋用线条划成若干小正方形，并记下每一小方块灰色 
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的深浅度，就可作出一灰色深浅度的直方图。 这就如图所示 0 
不同的峰代表图形深浅部分。设想一下，做些什么能使图象清楚 
明显。使明亮部分更明亮，黑暗部分更黑暗看来是一个合理的办 
法，这样就得到阖的深化图象。 

从原始图象变到深化图象的过程就等于把一张散布得不开的 
直方图换成一张有很大散布的直方图 a 这就与我们旋转一下我们 
电视 机的对比旋钮所涉及的过程一样，我们是在把直方图供布得 
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开一点 • 


5.7 当利.学家们构造频数分布 m 和本讲中所提出的囝的时 
犊，我们看到了它们相似之处。这就提醒我们用数学方程来表示 
分布。 


公式给出十分接近于所观察到相对频数的 数字。 用普哇松公式 


P(x) 


我们可以算出表 5.6 中的概率数字 


x ! 


O 


对 x =0 我们有0, 544 ,对 x = l 我们有 0*331, 等等。在以后 
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Bortfciewioz 注意到普哇松[ 7 ]在 1 S 37 年所发表的一个柢率 



死亡数 

相对频致 

概 率 

0 

0.545 

0 544 

1 


0,331 

2 

0.110 

«-m 

3 

D.01S 

4.021 

4 

0^005 

0.003 


费 A W 逢 d 9 
M 均方 i 儋峰 





的一次演讲中，我们将 S 多地谈到赀畦忪分布并解# 0.6! 是怎样 
得来的。目前考虑具有一个数学公式的含义，这就提出寻找一种 
产生机理-个科学规律的可能。 

ms . i 也 m 示出这呰概率， 

5.8 人们发现演讲3所讨论的高斯概 率曲线 对于描述许多 
不同来源的频数分布很有用。皮尔逊于1893年在 Gresham 学院 
的一次演讲中称它为正态分布。考虑一下.如果度量改细，图 
中的直方图将会怎样？组变得越来越小，直方图的边界就趋向于 
具有公式 


f(x)- 


(Tv/ 


的一条光滑、古钟形的曲线1 


(iU W 


5.3 用正规的数学表示式来代表总体的频数分布，其后果是 
很大的 ，概 率论的威力就被用来促进统计理论4结果，统计方法论 
不是建立在专用的方法上而是在严格的统计理论上，受过理论训 
练的统计学家之间发生了用概率模型去想问题的过渡。初开始的 
时候,数学模型慢慢地、谨慎地当作真实总体的频数分布的近似。 
今日某些人认为概率模型就是现实，并且认为较不正规的频数分 
布是现实的近似。据我的意见，我们应该继续把概率模型认为是 
近似的描述，有时近似描述“真实”世界上的频数分布非常好* 


小结十九世纪后期和二十世纪早期的科学文献中充满着各 
种数据的頻数分布，如同 Siom 咖早期几卷中那样9这一演讲 
提出了有关被马®死的士兵人数，杜鹃蛋的宽度，律师胜任与否的 
评分，有争议的作者的著作中用宇的.频数，陶 土烟斗 的斗柄小礼直 
径，和深化 B 象的灰色深浅度的频数分布。 

我们讨论了把数据归并成组。这样就产生了组的边界和每一 
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组的中点,组标,对每一组记下观察的頻教和相对類数。 

对连续的观察值，不论度量得多么细，组的选择将影响频教分 
布*对离散的观察值，不论度量是多细，可能值都是+—样的。 

在许多事例中，数据可以很好地用一个理论的槪率公式来描 
述 • 这里给出两个例子： 被马踢死的数据用 普哇松公式和蛋的数 
据用正态分布， 

J - 
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习 题 

1. 在一个小的大学中，本科英语专修生意欲进入研究生院的参加了研 
究生成绩考试，口语分数是 55 2 ,27&,342,675,725,340,432,4&5,627, 539, 

428,740*329, 370, 590 和 462 . 

L 按组 200 〜 300, 300 〜 400 ， .... 构造频数分布，说出你所采用的规 
定来处理落在组边界上的分数， 

b . 你用怎样的组边界既能得到相同的频数分布又能遊免观察值落在边 
界上的问题。 

2, — 位车主想把他的一辆大的 1975 年的汽车贴换一辆年代较近 
的汽车，他开始注意旧 车亩场 在一个有四十辆车的市场上，他摘下停在 
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那里的车子的 幸龄。 年龄算到最靠近的 - i 年是 3,7,3,4， H 2, 3, 4, 5, h 
6,6,5,4 t H 5 t 2， l ， H 6,3,2’ m 5， H 3,2,3,4,5， H 6 和5 + 

a. 作频数分布。 

b . 用纵标值表示频数，插绘 a 中所 得到顿 数分布的图形 a 

c . 桉组 0.5 〜1.5, 1.5 〜2.5,等等，把頻数分布表成一个直方图使» 
其中诸方块的面积代表频数。 

3. 在办公室工作的硏究中，经理关心到处理乇用广告来信的时间 ， m 
通知行玫秘书作一来信记录，四个星期内每天收到的无用广告信昱 55. 127, 
S&* 72,84,77, 115* 130,116,120^ 140* 125,131,115^99,126,145, 12U 83 ^ 

78. 


a, 应用 E 组54+5〜 74. 5， 74.5—94.5 f 94.5—114*5, 114 .5-134.5 
和 134.S 〜 154.S， 构造频数分布 o 

h r 如此标记纵轴使频数甩面积表示，画出频数分布的直方图。 

4- ■-个本地区汽车销伤商登广告宣传 EPA (( 美国、环境保护同，译 
注 > 话计 外还宣传实际汽油哩程数。23个人买了同 一 :「:!号的汽车后决定要比 
较-下他们的经验和车商的广告，每加论汽油的哩程数是 18.7,21.2,17. S , 
15.9,16.0,19.0,18.6^18.5, 20.2, 19,4, 19.3, 18.7, 16.1, 17,2, 19.2, 
18*7»19*3，19*9，18 + 8，1& j ，17 + 7,2 CK 2 和 20 + 3. 

a, 按组 lS.OS^ltOt IS. 05〜 17. 05,等等，均造叛数分布和直方 
图 9 

b , 直方图是否支捋广告所声称的每加伦19英呷 T 

5. 对上一»讲习题3中所得到的怍本构造一频 数分布 ，应用组00〜09, 
10〜19, … SO 〜99.把这一频数分布看作一个随机否合理？ 

6. 应用一张现行的道路图，构造你的州中城市大小的频数分布 。舰 
如此选择 K 组使区组数不致太多。 

7. MosulUr 和应用基本字的 ® 数分布作为研 究:有 争论作 
者的文章的一种方法 & 对本书毎 1 C 0 个字中“的^这个字所出现的次 数作一 
頻数分对另一本统计书作同样的事并比较此两分市，在每本书中，你只 
需要检阅几页就好了。 

8. 对表 5. 2的数据，按组 13.75 〜14,75, 14 ■ 75〜 15. 75,…，构造一频 
数分布和直方图。把这一直方图与阁5* 2 的直方图比较。〜下你觉得怎样？ 

1笙立你自己 的图象 深化工作方案。应用只有三种深浅度的灰色 
<比如兩不同硬度的铅笔>圯一张简单图象加色，用水平残和铅真线杷图象 


，糾， 




划分成 100 块方区琬在对这兰种深浅度的灰色，构造一献数分布扣 
—直方图。对这一图象用五种深浅度的灰色再做一次，对较亮部分用狡浅 
的，较喑部分用较深的，对此深化图象构造一頻数分布和一直方图 • 



演讲 6 


矩和百分位点 

6.1 在同一个冬季，帕莱梯亚人①仍被诹洛庞纳苏斯人⑦和 
皮奥 希人①围困，他们开始忧虑即将绝粮，因为雅典的援助己属无 
望，也无任何可以寄予希望的其他方法，他们和被围困在一起的雅 
典人计划逃离该地，爬过敌人的围墙，希望能冲出一条遢道，…他 
们在敌人 ® 墙面对帕茉#亚的一边找到一处碰巧没有涂泥 t 就在 
这里点数砖的层数以 fe 造出梯子等于墙的高度。许多人同时点数 
砖的层數，虽然一定有人会出错误，大多数人很可能得出真实数 
字，特别是他们數了一遍又一遍。此外，距离又不远并且他们所希 
望 看匀的那一处墻是很容易看清楚的，算上砖的厚度尺寸，他们訧 
这样得到梯子的尺寸。 [4] 

这个在公元前第五世纪应用众数或出现最多的值的例子为 
Wallis 和 Roberts[6] 所引用。这种为数据提出某种中心值的办 
法确实是很古老了； WalkerC5] 把应用平均数追溯到毕达哥拉斯 
时代。 数据中心值的概念在统计学中称为中心趋势，并且这一概 
念有好几种度量>最常用的度是均数、中位数和众数。均数足平 
均值 ，中位数是中心值而众数是出现最多的值。对2, 2, 3, 
4, 7, 9这些数，这三个数是 

均数= 4 
中位数=3 
众数=2 

三个数都很有价值,但用得最广的是均数。 

①帕茱梯亚 Platae * H 佩洛庇納苏斯 Peipponnesus 是 7 lT 希腊的两个池方：皮奥 
希 Boemi 是古希腊的一个共和国，一淖者注 
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6.2 在美国，大多数四、五年级小学生常被教会计算算术平 
均或均数。我们愿意把均数的初等定义和前几次演讲中的频数分 
布联系起来，并与后几次演讲中的概率分布联系起来。因此，我们 
将仔细地检査箅术均数，.并把它重写一下使它与骑数分布的关系 
更明显。考虑一个包含数2, 3, 2, 4, 2, 3，4, 5, 3, 2的总 

体，于是总体均数"为 



2+3+2+4+2+3+4+5+S+2 

15 



把分子中的数重新归并一下，我们得到另一种形式 



(2 X 4)+ (3 X 3)+ (4)(2) +(5 X 1) 

^10 


= 2(4/10) +3<3/10) + 4(2/10) +50/10). 

从而导致简单公式 

i-1 

其中々 记不同值， A 记不同值的相对频数，而 ft 记不同值的个数, 
计算也可以表的形式列出如表 6 _u 


*6.1 均值的计算 


Xi 

ft 

■ 

xji 

2 

i/10 

e/io 

S 

Vio 

9/10 

i 

s/io 

8/10 


1/10 

5/10 

总和 

l 



如果我们对〜个样本作同样的计算 t 记样本均数为*，并把它 
看成总体均数#的一个估计。 

如果每个个体是从上面那个小总体里随机选取的，相对频数 
变成概率,于是总体均败公式变成 
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在十七世纪巴斯噶相费尔玛的时期，一个比槪卓更原始 
的概念，期鎰的概念早已被人公认了。事实上,在早期的文章中，概 
率是用期望赚得来定义的，自从第一张人类生命死亡表出现以后， 
期 M 琦命成为一个众所周知的槪念也已有好儿百年了，现在我们 
耍把期望(期 M 的事物，期 望值〉 与均数联系起来。考虑表6_2* 


表 6.2 期望的寺命(年> 


年龄 

19 抑〜 1&02 

197® 

0 

4m 

72.S 

10 

51.U 


20 

42.79 

64.t 

>0 

35.61 

4S.3 

40 


3S.* 

SO 

2l.£fi 

17,2 

60 

14.76 

19,4 

70 

9,30 

12.4 

BO 

B.30 

7 .旮 

资料来源： 

(美 国）国纪: U 生统计中心 



虽然衮没有包含必要的信息以聆证表内各项数字，我们应承 
认这些数宇是对总体某些量的估计，并承认这类数据将是验证估 
计所黹 要的。 例如表中 49.24 这一数字是 1900—1902 年出生在 
实国的全体人民平均寿命的一个估计。 

概念上说来，只耍全体辩命确定了并被记录下来，就可以出上 
节中所说的那些方法箅出这一数字，把每一个寿命乘上相对频玫 
再求和，就可得出寿命均数。它可称为零岁或出生时的期望窍命, 
类似地可対全休出生于 1900-1902 年现在30岁的人或出生于 
1976年现在 2 0岁的人等等,算出他们剩余寿命均数，任何年龄的 
期望寿命只是那个年龄全体的平均剩佘春命。表6,2中的数宇沿 
根据概率模型和广泛的数据的估计 

期望值 已成为均值的同义词 * X 的均值常记作 E ( X ) 并读做 
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"X 的期望 值\ 由于均值并不总是总体的一个成员，我们应记住 
期望值并不是我们所期望的值I它是一个平均值。总起来说 

p a E(X> =： 2 - S XjP(A) 

i-p 1 卜 1 

为了计算的期望值，让我重复一逓节中的步骤 * 这时 

2 a +3 a + 2 a + 4 a + 2 a + 3 a + 4 a + +3 立 + 2 a 

E(x > = - w - 

= 2 2 (4/lO) +3 2 (3/10) +4H2/10)^+5 a (l/10) 

于是导致公式 

EfX^^Sxfr ； ^xiP^y 

i-l : -l 

很容易得出 

E(X^) =2 =S3fP(x t ) 

卜 1 

并且，事实上对 X 的任何函数 g<x)， 

E[g(X)] gC^i)^ = S 

仔细学习上面发展的细节，因为这样做会使你懂得这些公式 , 它们 
看起来可怕 * 然而却能传递简单意义* 


6.4 在前几节里，我们引入了中心趋势这个概念和该概念的 

几个度量，并且特别重视均数或期望值,在这一节里我们要考虑变 

异或离差这个概念和该概念的几个度量。在十九世纪后叶已有几 

个有明确定义的变异度量在使用之中。一个变异度量定义为与〆> 

布的均数的离差的平方,取平均再开平方,命名它为标*着是皮尔 

逊[ 3 ]的功绩 * 用符号<7来记标准差，用上节的符号， 

\/E[ ； (X^/x) £ J 

对于表 6 .i 的例子，标准差的计算列于表 n 
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在此提出一个赘告可能是有益的，初学的学生可能会受阻 f 
几个符号 M 不能掌握生要的思想,没葙实践，人们可能会忘记如何 
计算〜 对一个非统计工怍#，一般地学一些不讲计荈的概念，长 
久来说可能会更好一些，在所有的数宇总 体中， 总布 变异。 变好的 
度 S 很多， 最葙用的一个楚跤准差，如果没有 变异， 就足如果所有 
的数都相等，标准差为零。否则，它为正数。 

裹 $.5 标准 I 的计算 


mmmmmaaaBam 


I 9 ! 8 年，费希尔 [ 2 ] 引入方差这一名称来记标准差平方〆， 
它实质上和标准差有相同的特性，但被证明在许多场所较易处 
理。 

如果我们对一个祥本而不是对一个总体做表 6.3 中的计算， 
我们称样本方差为一个 估计, 并记它为沪，或常记为 S 1 = s<^- 

z)V(n-l) + 

e.s 力学中的矩和统计学中的中数两者之间的相似已被概 
率领域中的早期工作者注意到，而皮尔逊显然是:第一人在 1893 年 
在统计 学意义 下使用这个字*矩” <见 WMker [ 5 , 页 73])/ 看来 
期望寿命与一座桥的结构的重心有什么关系可能是十分惊异的, 
但一旦这两 个董用 数学表示出来，关系就明显了。 

求统计中数的年代已很古老，与此相仿,力学研究中矩的便用 
可以追猢到古代 KT 作家。 CajoritU 把重心理论归功于轲基米德 j 
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重心又称为一阶矩 6 

假定有 k 个不同质量的物体放在一玦板上，并平衡在一支点 
上如图6.1。重心的位置很容易由公式 

iixM , 

广 i— J 
。 = - ■■■- -- 



得出，其中\=第〖个物体距离板的左端的距离， 

第 i 个物体的质量。 



ffl 6 . 1 重心 

现在,如果我们记相对质量为 jn t = M ；/ i ： M ；, 公式成为 

!，■ L 

k 

C =5]Xira i5 

i = 1 

这个表达式与均数或期望值完全一样。 

在建造结构物时，重要的是要有转动惯量的某种度量 * 一种 
用了几百年的度輋焐下列公式给出的愤性矩， 

惯性矩， 

i- 1 

—个有关的度置是转动半径，它的公式是 

(转动半径 ( x ^ ov , 

力学和统计学之间的相似从频数分布的图形上来考虑可以看 
得更清楚，画出 L 2 节的频数分布,我们得到图6,2。 

如果我们把概率想作质量，熟悉的均数或中数可以想作我们 


■ 
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9 « z 矩的讨沦 

频数分布的重心。类似地，标准差可以想作转动半径，对很多人来 
说，这样的对比很有帮助，如果总体中的数环绕均数分散得很开 t 
可以想作是一个具有大的转动半径或标准差的非常不稳定分布。 


6.6 Walker 认为髙尔登是 中位* 和百分位数这些术语的 
创始人，虽然中位数实际上在更早一些时候已由高斯所提出 p 中 
位数的基本思想是把总体分为两个相等的部分——大数部分和小 
数部分——而中位数是分界线，这样的想法包含某种程度的不确 
定性（比如考虑总体1，1，1，1，1，2,它就没有天然的划分但 

是对于实际数据的总体不会有什么困难，所以中位数是用得很广 
的 o 


百分位数是高尔登(见 Wdk er 〔5]> 发展的，他的目的很接近 
于近代用法，基本思想是把总体中的数由小到大排列起来，然后把 
总体分成一百等分，于是，第卯百分位点是一个数,使得总体中百 
分之九十的数较小而百分之十的较大。注意，第50百分位点据定 
义就是中位数。 


6.7 仅给出几个数，应否作任何计算是可怀疑的。然而频数 
分布和图可以帮助我们理解一个大的总体，此外，诸如均数，标准 
差和百分位点等#数可以是有帮助的，然而要理解一个数字总体, 
只有和经验一起,它们才能起大的帮助 * 



小结中心值的度量诃以至少追搠到公元前第五或第六世 
纪。在许多可能的度董中，用得最广的是均败，中位》和众败*众 
数是出现得最多的值，中位数是中间值,而均数是平均值。 

X的一个函数 g(X ) 的期望值定义为 2 g ( x > P ( x ) 并记为 
E[g(X)] 0 这一术语与应用期 望寿命 这一名称以描述人类平均寿 
命是一致的 > 有了期望的定义，总休均數就是X的期望值 E(X> 并 
记之为心样本均败，记作又，是总体均数的一个»计 P 

总体 变异最 常用的度量是 方差， 定义为 E[(S：- 并记之为 

V。方差的平方根，记为 cr , 称作标准 it 样本方差和标准差，分 
别记为 S a 和 S, 是总体方差和标准差的估计。 

均数和方差同重心和转动惯量之间的类似促使使用矩这个词 
以描述均数和方差。 

在均数和方差之外，还用百分位 致来度 量中心趋势和变异。 
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习 题 

1 ‘ 试计算数字总体8，8，8， a , 8， 8, 8，8，和 a 的0^,众 
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数和中位敛 4 

2. 用代数证明一个常数的均数就是那个常数 • 一个常数的际准差为零， 

3. 计算下列两组数的 P 和 

10 ，I 7，9，5, 12，8，6， ft ， 2和 20 t 16，14，18，10，24， 3 C ， 
12，16， 4* 

4. 用代数证明，如果一组数的均数和方差是辞和那么把这组数的 
S —个效乘上 C 之后所得到的一组数，它们的均数和方差是 CP 和 Cb 、 

5. 下列两组数据哪一组变异得更大些？说明理由， 

组 l t 1&，25，16，22，30，23，24，25，23。 

组2*110， 1 U ， 125, 116，122，130, 12心 125, 123 # 

6. 用代数证明把一组数的每一个数加上一个常数 C 后所得到的一组 
数，它们的均数和方差是 # + C 和 

7. 如果一个一位数是随机地从整数0, 1，2，++*9按等概单而产生，什 
么是这个数的期望值 

8+用表 5.1 中的数据，估计披马踢死的期望人数心它是否就是5,6 
节所给出的公式中用到的数？估计标准差 

S + 用表 5.2 中的数据，估计一个蛋的期望宽度#和标准差用组标 
14.00.14.50，…来做你的计算。 

10. 试用均数和标准差的变动来解释在你的电视机上亮度和对比度控 
制的影响。 

11. 用例子来验证 E ( XO * 

E < XO =2 x?fi 

i -1 

12, 重复习頭9，把该题中每一组标减去16再乘上 ICO 所得到的一组 
代号值，求均数及标准差，记它们为？和5\要得到习中的5和 S ， 
应做什么消除代号工作？ 

13. 用代数验证习钙 ] 2所包含的结果 | 即，如果 X、a + bX ， 那么 

^ = a + b/* 

和 a 1 * ~ b 2 a 2 

注《这一结果描述一种图象“深化就是移动直方图的均数和改变方差 d 

14, 计箅演讲 5 习题1中硏究生成缋考试分数的均数#和方差再 
应用频数分市中的组标和频数 i 十算均数和方差。 

15, 计箅演讲 5 习迦2中所描述旧车市场中汽车年龄的均数和方差，用 
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頻数分布中组标和頓数做同样的计算，结果不同吗？为什么同或为什么不 
同7 

16 1 把浪讲5习题3中的数当作一个随机样本，计諄每天收到无用广 
告信的样本均数和样本方差，用频数分布的组标和頻数重复3样的计箅。 

17. 把演讲5习题4中23个 情況当 作一个样本，计箅汽油哩程数的样 
本均数 i ， 和样本方差用频数分布的组标和姨数 MM 同样的计 






概率的解释 


T.1 概率这个词有奸几个意义，应用英语的人习惯于一字多 
义,要从上下文确定其意义，然而有时使人震惊的是，用在技术理 
论中的字也不是唯一定义的，这些字或词如电子，质量，能和力怎 
能有不同的意义呢？概率怎能有不同的理解呢？ 

概率 这个词 基本上有两种用法：<1)某个系统的一个 内在特 
往 ，这个特性不依赖于我们对该系统的知识对某一陈 述相信 
S 度的度量。 在某些概率学者和统计学者之间，对概率这个字的正 
确意义争论已有多年0在其他 时候，由 于不能区分两个基本意义， 
结果又 是剧烈 的争辩 6 争论至少可 追溯到 年 von Mises « 
[8] 和 1921 年 Keynes 的 [4], 并且一直继续到如今 t 这种情况可 
用两本初等统计书来说明。 Sa V aM [7] —开始就用概率是不确定 
性的一个量的度置这样的 观点。 N 0 Mher[5] 提相信程度的 理解是 
—个次要的理解。概率这个词的不同用法*贝叶斯学派争论的中 
心问题，我们将在演讲 31 中 讨论。 


7*2 科学理论是建立在没 有定义 （或定义得 不好〉 的名词上 
的，定义质量、力和加速度的尝试都是不满意的，然而依据建立在 
这些名词上的理论，飞机在飞，火车在行驶，卫星在围绕地球运行。 
电子有时描述为粒子，有时为波，有时既是粒子又是波，即使这个 
词没有确切定义，而晶体管技术仍在前进。概率存在类似的情况。 
虽然概率这个词没有明确的定义，但统计方 法和柢 率模型却证明 
它们自身很有用* 



7- a 在我们试图描述的概念和我们想做的描述（模型> 这二 
者之间作出区分是有益的，表 7.1 强调了这样的区分。 

如果一位讲师问全班同学什么是一个正规硬币落下来图朝上 
的概率，回答可能是响彻全堂的“二分 之一％ (注意在上一句中概 
率既用来表示硬币的一个特性又用作相信程度的度量。）二分之一 
这个回答无疑是一个有条件的答复;然而清楚的是，回答是描写硬 
珩_个 特性的尝试，而不是描 述相值程度的 尝试，特性是多次投掷 
中图朝上的比例，或多次投掷中的相对频数 U 为了说明这个思想, 
我投掷一个硬币 50 次，结果如表7,2所示。第 一 (纵>列是投掷 
的次数，记作 ri ， 第二列列出投掷的结果，标作 H (图 朝上〉 和 T 
(宇朝 上〉。 任何指定的一次投掷，出现图朝上的总数列在第三列 f 
并记之为 n ( H >. 最后,图朝 上的相 对頻轚 ，用 n < H >/ n 来计算 ，？ ij 
在第四列。这些结果用图画在图 7*1 中，注意50次投掷后相对频 
数就停在二分之一附龙。我们将怀疑如果再投掷下去，相对频数 

将在二分之一的上下摆动，并将停在甚至更靠近多次投掷中相对 
频数二分之一。 

有好几个投掷硬币实验记录在文献中，一个著名的例子由 
Kerricfc[3] 给出 c 在第二次世界大战中，他被拘留在丹麦的 Hald 
时*做了几个实验。例如，他投掷一枚硬币一万次，从一个坛子里 
— 取出两个球取了五千次。在硬币授掷的实验中，初开始时，图 
朝上的相对频数摆动得很苈害，在一万次投掷后，它停在二分之一 
的邻近，在最后一次投掷得值 0*507. 


表7,1杈牟的理解 和糢智 



—个系统的待性 


1 + 炅#极限 



(多次实验中的簡纹） 2. you M 彳 ses 的集 f 木 

相信程度的度規 1. 逻辑关系涅论 


2. 主观慨率 


多次实验中的相对频数没有明确地被定义，但它却有一定的 




9 tr . 2 因相上的相对頰数 

-« to +- 一 _ —-- --- 

CH) ji(H>/ii n H 或 T 



15 20 25 30 35 

Bli 图朝上的相对锇数 









真实性,任何人都可通过投掷一枚硬币以取得经险0 


7*4 试图描述多次实验中的频数特性的一个最明显的方法 
是用数学极限，通常你这为概寧的 频数极限定义 。设以 n 记试验次 
数,并以 n ( H ) 记一个 氓件 H 出现的次数，则 H 的槪率*记作 P ( H >, 
定义为 

fl 

虽然这一定义没有能描述出投掷硬币所呈现的现象，但它曾被证 
明很有用，如果图朝上的相对频数趋向于二分之一作为数学极限, 
那就会有一点，在那里相对频数很靠近二分之一并且在更多的投 
掷中不会远离。但是我们必须承认，在任何一点有无很多个宇朝 
上的可能。因此图朝上的相对频数在一万次后可能比二万次后更 
轺近二分之一，作为一个数学极限，这是不允许的。 

7.5 von Mi ses 作了勤奋的努力以频数极限来定义概率。 
为了摆脱一个序列 〈渚 如投掷硬疖的例子）没有频数极限的困难 t 
von 把他的定义限制于具有频数极限的正则序列，对这种 

序列他给了集体（奥文 collective 德文 kollectiv) 这一名称。 
大家并没有普遍感觉到 von Mises 的工作克服了频数极限定义内 
在的 困难， 如 H a ckir*g[l] 所说，如果存在怀疑论者，他们坚持 
认为一枚哽币在多次投掷中出现图朝上的频数，不是任何事物的 

特性，他们有这么些正义在他们一边；特性从来没有清楚地定义 
过％ 

7.6 概率作为相信程度的度量，它基本上有两畜 理论： 逻辑 
关系理论和主观概率理论，逻辑关系理论提出，概率是一个证据陈 
述支持另一个陈述到什么程度的一种度量， Keynes 于 1921 年首 
次提出这一观点，近年来这一观点受到 Jeffreys[2 ： 和一些其他 
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人的拥 护。 

主观概率理论把概率看戒完全由个人决定，随人而不同的，这 
种理论依扉打赌的处境来取得每个人的概率这样用打赌的思想 
显然是 1931 年首先为 Ramsej [6] 所提偈。 

7 + 7我用下列注释来表明我的态度* 

1. 概率有两种主要的解释。 

2_如果对这两种解释能用不同的字句，很多争论可以解决。 

3. 要让概率的不同名称得到普遍的承认是不可能的， 

4-两种解释都有用。 

5,在统计学中相对频数的概念 m 得比相信程度的解释来得 
多。 

S , 贝叶斯派统计的近年工作对统计中相信程度的解释作了 
很重要的进展 t 

小结概率是一个没有定义的名词> 另外一个说法就是它有 
许多不同的意义，这个名词最通常的两种理解是(1>物理系统的一 
个内在特性，和<2)对某一陈述真实性相信程度的度量。 

定义概率为一个内在特性的主要尝试是把它看作一个无穷数 
列的极限相 对鳎# L 这一尝试的困难在于数学极限，它块乏某些 
我们希望有的特性 ， von Mises 试图绕过这一困难，把无穷序列族 
限制于具有所希望的特性；他称这些序列为集体。 

概率作为相信程度的度董曾被发展成用陈述间的逻嫌关系来 
讲, 或者用个人独特的信念 称为主 观概率来讲。 

虽然概率作为频数极限没有给出一个满意的 定义， 但做多次 
试验, 诸如投 掷一枚 *市, 就可观察到这现彖并看到相对频数倾向 
于停留在一个极限值附近。 

概率这个单独的词继续用来描述梠当不同的思想，结果引起 
某神争辩，幸运的是运算规则对两种解释都是一 样的。 
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习 题 

i* 为了对解释的问题有所认识，问几个人"什么是概率 

2. 我问一班73个学生下列问“我投掷一枚正规的美国硬币25次而 
得到23次图輞上和2次字朝上„什么是下一次投掷中得到®朝上的概率？ 
你可以投票回答 U) 大于二分之一， <b) 小于二分之一 ,（c ) 二分之一％结 
果是I 

大于二分之一 12 

小于二分之一 10 

二分之一 44 

羿权 7 

你想投 (a) 票的人采用什么解释？投(1>>累的人？投 <c> 票的人？ 

3. 在报告气象新闻时，用了概率的计么解释？ 

4. 在表 7. 2的硬币投掷实验中，我们能否肯定地说，当 ti 趋向于无穷 
时，图朝上的相对頻数趋近于以二分之一为极限？我们能否说这样一件亊愤 
发生的概率很 *? 

5. 对一次体育比赛的结果给出打赌比例財，用了概率的什么解释？ 
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e , 投掷一颗骰子 so 次，每次记下是1出现还是1不出现。对 n ( i)/ n 
作一个类似于表 7.2 的表，然后把结果画成如图 7.1 的图，这个比是否象投 
掷硬币的比在50次之后那样稳定下来？ 

7 + 在下列每一陈述中，用了概库的那个或那些解释？ 

a . 在一指定的梭发电厂一次熔化 ( meltdown ) 的概率是 O.OOOOU 

b . 圣母玛利亚(美国一 大学〉 足球队被排入头十名的槪率是0.9。 

C . 在另一行星 上没有 生命的概率是0,05。 

d . 在一架飞机上发生一次引擎支架事故的溉率是 0.00 U 

e . 在今后20年中有足够石油供应的概率是0.001。 
r 买一辆新汽车而有一主要缺陷的概率是0 + 007。 

8 + 投掷一对很子1卯次并记下出现一对六点的次数，记下—对六点） 

/ a 并作图如表 7. 2和® 7.1. 要使结果落在 | 的邻近，投掷多少次看来是 


必要的。 

9. 一 位讲师被卷入一次说学生舞弊的争论中。最后证实了这个学生实 
际参加全部四次考试（而不是在某些考试中光坐一坐）的概率是0.9，发现 
他 汝有参加第一次考试，那么他参加后三次考试的概専是大子还是小于0.打 

10. 在一次足球比赛中，一个 朋友愿 意以十 元对 五元赌 A 队获胜^ 卄么 
是他对 A 队获胜的主观概率？ 
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演讲 8 


概率法则 

8*1 在上一讲中我们讨论了概率的解释，这是一件困难的、 
涉及哲理的、有争论的问题。下一步我们将讨论概率的法则 〈概率 
的计算）。法则是很容易表述的，不涉及哲理并且是几乎全怵公认 
的。近年来流行的讲法是叙述几条公理，随后 由这些 公理得出一些 
法则，这样讲法常称为公 理化槪 率论。从我们的观点，公理化方法 
完全绕过了解释这一重要课题而集中于为计算槪率打下基础。公 
理化方法是一个好方法，因为对概率允许进行的运算几乎是完全 
—致的 

我们将以相对频数解释作为主要根据来叙述一些定义和公 
理，但是我们也将把这些公理同相信程度这一解释联系起来 

L 2 近代集合论为表述必要定义提供了一个方便的工具 # 
—切可能结杲的集合称为样 本空闾 ，记作 S t S 的任一子集羽:为一 
个事件，常记作 A ， B ， C , 等等。为了说明思想，假定我们从红 
桃 A ， K , Q 三张牌中抽取一张，有三个可能的结果，记样本空 
间为 

S = { A ， K , Q }, 

有八个可能的事件 （子 集〉：包括 S , 空集0， { A , K },{ A , Q }, 
{K* Q }， { A }, { K }，{ Q }. 学生可能觉得奇怪，在只抽一张牌 
的时候，竟把 { A , 列为一个事件。然而，我们为了能讨论一张 
牌是 A 还是 K 的概率，所以需要 { A ， K } 作为一个事件。同样，我 
们需耍 S 作为一个事件，使能考虑一个 A ， 或 K ， 或 Q 的概率，把 
空集0包括在内作为一个事件并不是由于直观的考虑，它被描述 
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成一个亊件纯粹是为了数学上的方便，没有它，我们的某些运算将 
变得繁琐。 

8.3 我们现在将叙述有关一个样本空间中任一事件的概率 
的某些公理，这些公理起因于多次实验中相对频数的概念> 它位于 
零与1之间，这就导致第一条公理 

公理 1对每一事件 A ，0< P < A >€1 因为每一个结果属于样 
本空间 f 所以 S 的多次实验的相对频数是1,例如在上一讲中投掷 
硬币的实验，对每一个 ru u < H 或 T>/n = ： L 这就导致第二公理。 
公理2 PCS ) = 1 

下一公理虽然不是如此平凡，但自然地从相对频数的思想得 
出，常常我们要问 A 或 B 出现的概率，在上一节的例子中我们可能 
问 P ( A 或 K ). 用相对频数来说，淸楚地看出 

n ( A 或 K ) A ) n ( K ) 

n < 牌) = n (牌） "+ 

这就导致下一公理。 

公理 3 如果 A 和 B 不相交 （无公 共点），则 

P(A 或 B ) = P ( A ) + P ( B) C 

用 相倍程 度的话 来说， 这个思想是说 t 信息必是可加的，如果 A 和 
B 没有什么公共的。 A 和 B 不相交，用集合论讲法就是 AHB = 0 
(空 集)。还有 A 或 B 可以记作 AUB ， 这第三公理通常总称作加 

法法埘 4 

8*4 应用集合论的运算，我们可以从刚讲的三条公理推导出 

几条重要的法则。我们将略去这些推导，因为这些法则可以同样 

用相对频数的想法直接得到。然而，把这些结果想作公理的推论， 

正象几何的定理是给定公理的推论一样,对学生是有帮助的。 

法 P (0) =0 

法 )4 2 P ( A ) = 1- P ( A ) 其中 A 表示非 A ， 为了说明法则 
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2, 在整副扑克牌中抽一张得到 A 的概率是 *4 - =+，而得不到 


A 的概率是 = 

85 在概率的学习中很快就会自然地问到出现两个或多个 
特征的情况，诸如一张牌既是 A 又是黑桃或奔一张牌既是 A 又是 
红色，等等。属于这样一个联合事件的概率称为联合概率，并记作 
P < AB ) 或用集合论的符号 P ( AnB ) 0 为了说明思想，考虑表 8*1 
所示的样本空间。 


用目测就会得出 




P(A) = 

4 _ 1 

52 ~ 13 

P<S) = 

48 

52 

12 

IS 

P(B) = 

13 1 

52 ' 4 

P(B> = 

39 

52 

3 

=■ ■■ 

4 

P(AB) = 

1 

52 

P(AB) = 

12 


P(AB) = 

Z 

52 

P(SB)^ 

36 

52 

h 


表 8.1 牌的问超的样本空间 



AfA ) 

非 A ( i ) 

总 

黑桃 < B > 


12 

13 

非黑桃 ( S ) 

% 

36 

39 

总数 

4 

48 

52 


涉及两个事件的概率称为联含《車。涉及只有一个事件的概率称 
为边缘概率，因为边缘概率可以明显地从表 S . 1 的边缘上的数字 
获得 。 

样本空间通常限于一个子空间，这时概率是这一较小子空间 
上的条件概率。当我们申请一张人寿保险单时，保险公司可能要 
求限制存活概率于一个较小子空间渚如没有心脏病的一组人上 
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在抽牌的实验中，假定我们要求在已知的黑桃牌中抽得一张 A 牌 
的概率，我们把样本空间看作只包含黑桃，于是所要求的概率是 

记这为 P ( A | B ), 其中那根铅直线读作“已知' 


8-6 记 A 中点子的数目为 n < A ), B 中的为 n ( B ) 而在 AB 
中的为 n ( AB )。 从相对频数思想，很自然地得到 


PCA | B ) = 


cXAB) 

ii { B ) 


_ n ( AB ) n ( S > 
n ( S ) ii ( B ) 

^ P ( AB )/ P ( B ), 

唯一的条件是 P ( B ) — 0, 这样我们还得到 

P ( BJA )^ P < AB )/ P ( A >. 

假定 P ( A )#0, 

S *7 假定 条件槪 率存在 [ P ( A >_0 和 P ( B ^ O ： l , 我们可以 
由交叉相乘得到另一法则 c 

法 WS P ( AB ) = P(A | B ) PCB ) = P(B I A > P ( A ) 

F 

4_8 用表 82 的死亡数据以说明前几节的法则 # 以 A 表示 
—个人至少活到50岁的事件，那么 

P ( A ) = 0.90718. 

在50岁以前死亡的概率为 

P ( A ) = 1^ P ( A ) ^0-09282^ 

令 B 代表一个人在 SO 到 51 岁之间死亡的事件，这时 

P<B) = (90718 - 90135)/100000 = 0*00533 ， 

在这一情况中 ADB = B ， 因此 

P ( AB ) = P ( B )- 0*00533， 
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] 976 年存沽人数和死亡率 


每十万沾 
中存活人数 


;个存佐 
者的死亡窄 


50 

90,710 

6-43 

51 

90,134 

7.00 

52 

39,50t 

7^2 

S3 

SS.S22 

5.30 

54 

辟 , 085 

9.03 

55 

87,390 


56 

86, 437 

10.60 

57 

⑸521 

use 

68 

Hi, 532 

IZ.ll 

S9 

83 h 4S8 

13 + 98 

60 

82,2^1 

15-42 


资料来源： Metropolitan Life A^urance Co < ia 7 fi ) Statisiicol Bulletin « 

〜 9. 

且 

P ( A 1 B ) = P ( AB )； P ( A ) = 0,00643. 

于是每一年龄的死亡率是已知达到给定年龄的人在下一年死亡的 

条件板率。 

« + 9观察力强的学生可能已经注意到在表 8.1 的抽牌例子 

中， P ( A ) = P ( A | B )=^-. 这只 是说： 得到一张 A 牌的概率不受 

知道这张牌是黑桃的影响，按直觉意义说,这两事件独立。注意，当 
P ( A | B ) = P ( A ) 或 P ( B | A ) = P ( B >, 法则3告诉我们 P ( AB )- 

P ( A ) P ( B ). 下面我们给出独立的正式定义。 

定义当且仅当 P < AB ) = P < A ) P < B )， A 和 B 为独立。 
这里概率的相乘常称为乘法法埘， 

*.10 我们仍然需要有关 P < A 或 B > 的法则，看了图 8. 1,很 
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容易訧可得出这一法则，相对频数的想法建议 

n(AljB) _ n(A)+n(B)^n(AnB) 

■■ ■ S ■ -ii. m 

n ( S ) ft ⑸ 

这就导致下列法则： 

法刻4 P(A 或 B ) = P < A ) + P ( B )- P(ABh 
当 A 和 B 互不相交 (AB = 0)， 这时 P < AB > = 0, 得到法则4的一 
个特殊情况， P ( A 或 B ) = P <_ A > + P ( B ), 在概率文献屮，不相交 
事件称为互斥，互斥事件的概率相加常称为加法法埘* 



A * » A 或 fi 的文氏 ( Vetrn ) 頌 

•- it 条件槪率的一种特殊写法曾引起广泛的评注*大家知 
道的贝叶斯法则或贝叶斯定理，它只是把一个条件概率用其他条 
件概率和边缘概率来表示。 

贝叶斯法刺<法朗 5) 

PfBiA 卜 P ( A 1 B ) P ( B )_. 

^ f ^ P ( A | B ) P < B )+ P ( A | B > P ( B > * 

例题有些书的作者在经典著作的学者中常常是一个争论 
点，演讲 5 曾提到用一种统计调査法来研究一本书有争议的原作 
者。假定我们有一批书，其中有儿本是保罗写的，并假定我们要检 
验原作者。令入=指明一部给定的著作为保罗所写，8 =这部书确 
是保罗写的这个事件，假如我们对检验方法有充分的信心，因而 

P < A | B > = 0*95 和 P ( A | B ) = 0.10 

如果检验指出一部指定的书是保罗写的，我们感兴趣的是，已知检 
验如此指出时 * 保罗真是作者的概率，即，我们感兴趣的是 P ( B | 
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*= 0*5135 

另一方面，如果 P ( B ) 大，比如 0.90, 

P ( B | A ) = 0*9884 

在两种情况中，检验指出保罗是这篇奢作的作者这一事实给出了 
—个比边缘概率来得大的条件概率。然而 t 如果 P ( B > 小的话， P(B 
IA ) 却没有能象预期的那么大 * 


8*12 在这一讲中 * 我们介绍了概率计算的基本法则 p 某些 
法则纪 直觉的 f 另外一些却不是。在应用甚至更直觉的法则 t 有时 
会遇到惊奇的答案，过细地应用严崚的法则所得出的概率结果常 

常和我们的直觉不相符合，这就迫使我们改进我们的定义和检奋 
我们的逻辑。 

在下一讲中，我们将研究衹率计算的问题， 

小结概率的公通化理论把概率作为一个满足某些公理而没 
有定义 的量； 然后从公理得出法則和定理 g 

全体可能结果的集合，记为 S ， 称为样本空间， S 的任何子集 

A 称为一个事件，在 A 和 B 两个事件的情況中 t 每一个事件的概率 

称为一个边缘概率，两个事件的概率，记作 P < AB > 称为联合概率， 

在限制样本空间于 B 中的点时， A 的概率称为给定 B 时 A 的条件 
槪率, P ( A | B ) 

联合概率等于一个条件槪率和一个进缘概率的乘积，即 

P ( AB ) = P ( B | A ) P ( A ), 

当眹合概率等于边缘概率的乘积时，事件称为独立的 • 
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A 或 B 的概率为 

P(A 或 B > = P ( A ) + P ( B )» P ( AB ) 

当 A 和 B 不相交时，称它们为 S 斥, A 或 B 的概率只是边缘槪率之 
和。 

给出了 P ( A 1 B )， P ( A | B )* P < B ) 和 P < S )， 由贝 时斯法 W 
可算出 P ( B | A ) fr 就是，它把一个条件概率用另一个条件槪率和 
适当的边缘概率表示出来。 
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习 班 

1. 一个坛子中有四个球，编号为 1, 2, 3* 4, 从中抽取一球，给出样本 
空间和全体16个可能的事件 4 

2 . 由习题 1 的坛子里抽两个球,一次抽一个球，第一个球抽出后并不放 
回再抽第二个球，列出样本空间中六个可能的结果和64个可能的事件4 

3. 对表 8.1 中的样本空间，计算 

P<A|B) i P(A|B>* P(B|A)«iP(BtA) 

4. 由表2的数据，验 a 50岁到59岁那些年龄的死亡率* 

5. 由表 S*2 的数据，计箅存活到61岁的概率， 

6. 依据表 8.2 的槪率陈述，釆用概率的哪一种解释？ 


■ 
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广一个坛子内有三个球，编号丨， Ifpl . 从这坛子内随机地抽取 F 1 个 
球， 次 抽一个，第个球抽出后并不放回再油第二个球 a 

a - 列出样本空间中的六个点，每个点表示抽到第一个球扣第二个 ® 的 
结果。 

b . 令 A 代表第一次油得的球为〗这个事件，确定 n < Ah 什么是 F ( A )? 

c. 令 B 代表第二次抽得的球为I这个事件，确定 n( B \ 什么是 P(B)? 
令 C 代表第一次抽得的球为1这个事件，确定 n(C). 什么是 P { C )2 

t f ! 么是 P < AC )? 
r 什么！ 

8. 假定第一个球抽出后放回坛中再抽第二个球，敢习题 TV a 中的样本 
空间将有九个点， 

3. 假定习麪7中球 I和1为白色而球1为红色，令事件 A =第一个油 
得的球为白色，并令事件 B =第二个抽得的球为白色,确定， 

a . P ( A > b . P ( B ) c + P < AB > d . P < A | B ) e , P < B | A > 

H 在一副打桥牌的牌中，从四张 A 牌中随机地抽取<不放回）两张， 
a * 列出样本空间中的12点。 

b . 令 A 代表抽得黒祧 A 这个事件，列出 A 中的点并确定 P ( A) ff 

c . 令 B 代表抽得红心 A 这个寧件，列出 B 中的点并确定 P ( B 、 

&确定已知抽得红心 A 后再抽得黑桃 A 的概率 P < A | B )。 

e. 确定已知抽得至少一张红色 A 后再抽得黑桃 A 的概率 * 

11, 证明命与任何事件 A 浊立，并证明0和 A 互斥 * 

12. 投掷. ■枚均勻硬币两次，令 A 代衷第…次投掷屈朝上的搴件， B 代 
表第二 次投邱图餌上叻事件 # 证明 A 和 B 浊立但不互斥^ 

13+如果我们被告知两个事件独立，能否结论说它们并不互斥 

I 

14. P(A 或 = | 

1 q 

P ( A >^4 

4 

P ( B ) = i 

4 

问 A 和 B 是否互斥？ 

15. P < A | B ) = i P ( B >-|, P ( BfA)=-^ f 

求 F ( A ) 和 P ( B) c 
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16. 已知 P<A) = 

7 

16 

P<B)- 

8 

m 1 

id 

P(C) = 

6 

ie 

P(AB)= 

3 

7 

IS 

P<AC>= 

3 

16 

P(BC) : 

3 

=■ 

16 

P(ABC) = 

2 

16 




a. P<A 或 B 或 C ) = ? 

b. 画出文氏图表出本题的渚概率。 

17. 已知 P(A) = P<B) = P(C) = + 

P(AB) = P<AC) = P(BC)=-j 

P(ABC)=0 

a , 画出文氏图以显示本题的各个概率。 

b. 证明 A, B 和 C 两两 独立但不是总起来独立* 



概率计算 

所谓概率的经典定义可这样陈述，如果一个实验有 II 个 
等可能的结果并且这些结果中 n ( A > 个具有特性 A ， 则 A 的概率 
为 


P ( A ); VA - 〉 .. 

n 

当然这不是一个真正的定义，因为它用到“等可能 # 这个词 f 而这个 
词已陪中设想了概率的一个意义。然而，这个定义确实提 供了一 
个把我们对槻率的想法用一定的形式提出来的有用途径。在本讲 
中我们将介绍几个例子，它们的样本空间中的所有点都取作等可 
能的。 

例1 一个实验包含从盛有两个白球一个红球的坛子中依次 
取两个球而第一个球取出后并不放回。我们要问第二个球为 

白球的概率是多少？对这个例子，我们记球的号码和颜色如 
下 * 


球号 

颜色 

1 

白 

2 

白 

3 

红 


样本空间用球号表出如下。 



结果 第一球 第二球 


下表列出事件 A , 它代表第二个球是白的事件。 

结果 第一球 第二球 



因此第二个球白色的概率是 n < A )/ n = + = j 。 这一间答可能与 

学生们的直觉想法相反，他们可能不自觉地用了条件概率的想 
法。 

在这一例子中，列出样本空间的全体点 t 并数一下属于事件 A 
的点是一件简单的事。对较复杂的问题，计数可能是一件繁重的 
事务，除非我们利用计数公式和计数法则。 

9.2 数学中充满着迷人的计数问题，而解答这些问题中的某 
几个却要求最髙的智薏。然而许多问题可以用初等的排列和组合 
公式来解决。例1中球的排序称为铕列，因为次序是重要的、即1, 
2,3的排法与3,2,1是不同的，与此相反，桥牌手中一副牌是一 
个组合，因为牌的次序不重要，一手牌的奸坏不依赖于排的次序。 
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在演讲 2 中说过，排列这个词是贝努里第一次提出的。 组合 这个何 
按现代的意义是 I 666 年第一次为莱布尼茨用在 《 关于组合技巧的 
论文*中。 


件事物中一次取 r 件的组合数记作 ( 并给出为 


(?) = 


m 


r ! ( n-Ol 


其中 ril (读作 n 阶乘）为 n ! = n(n -1) <n - 2> …1,并约定0!= 
1。 


件事物中一次取 r 件的排列数为 P ( n , r > 〜 、， 。为 

( n — r ) 1 

了说明这一公式的应用,考虑例 1， S 中的点可由 P (3 ? 2)-^-6 
得到 

例2 —个实验是从洗通的桥牌牌中分发13张牌。一手牌含 
7/—张黑桃 A 和一张红心 A 的槪率是什么？要解决这个问题，谙 
注意我 们需要汁算比 n ( A )/ n ， 因此主耍问题就是一个计 数叫 

现在《只是从整副牌屮选取]3张牌的方法数，分子 

n ( A ) 需要稍为想一想，在每一手含有两张指定的 A 外.还有115泛 

: K : 他的牌，这1 】 张可以有选择的方法，因此概率是 

Vll !39 lA 52! / (52 H 51) 17 


9*3 总结这些思想，许多简单问题可以概念化为 :把所 有被判 
断为等可能的全体可能结果列出成一张表 S , 和这张表的子识 
A， 所求的概率于是可由 A 中的点子数 n(A) 对 S 中的点子数 n 
的比而得出。这时就需要计数的方法,这一需耍可用排列和组合 
来部分解决。 

对初学的学生，用组合的公式还是用排列的公式常常引起混 
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乱 （ fe 括我，也要搅混) 6 如果我们仔细想清楚样本空间 S 中的点 
子，这一混乱是可以避免的，如果它们是排列，当然用排列公式 
果它们是组合，用组合公式。 

9.4 著名的生 B 问题是这样的 | 从一个大的人口总体中随机 
地选取 r 个人,求至少有两个人有相同生日的概率 〈见 FeUer [23 
和 Mmtf or d [3] 的一篇较新的文 章〉。 不考虑闰年，样本空间是一 
切可能的 r 元 ( h ，&，… xj 的集合 t 其中每一个 x 可以等于1，2, 
3,…，365。于是样本空间的点子数是 

n ( S ) = (365 > r 

令 A 代表至少有两个人有相同生日的事件； S 代表所有的 生日都 
不同 c ； A 是365个日子中一次取 r 个的所有排列的集合 & 因此 

n (5) - P (365> r ) 

于是 

P<A) = P <365, r )/(365 V 
而 

P ( A )= I - P ( A ) 

对不同的 r 值，我们可以计算 P ( A ) 值，当 r = 23， P ( A ) 超过二 
分之一。因此,对23个或更多的人在一起，打赌说至少有两个人有 
相同的生日是有利的，矜被好几个人证明[例如 Munf 0 rd [3] >,如 
果生日不是等可能的， P ( A ) 还要大。 

9.5 心灵科学研究会于 18 S 2 年创立于伦敦，因为很多人认为 
一些超自然的事件（怪异的和不能解释的种种事件〉需要作科学 
的研究。心炅学这个术语就是用来描述实验的心炅科学研究的一 
门学问， Thafcur [4] 和 Thoul ess [ 5 ] 对超感觉力的实验研究作了 
—个总的评述，由于早期的猜牌实验，人们想出了许多实验以检验 
超薄觉力确实存在这个假设。不管结果州何，总存在这样的 问题： 
这些结果是否可以用机会来解释。事实上 / rhouless 那本彳 i 有一 

- 75 • 



章的标题就是“外观上的成功能否用机会来解# 

—个超感觉的人随机地分发黑桃和红心中 A，K,CU 等牌， 
牌面朝上，他注视这些牌并集中注意于它们的颜色。在另一间房 
内，一个同道者知道有四张红牌和四张黑牌，在一个公正的观察荇 
所发出的一张牌已发出的信号下，试图猜测这张发出柏牌的颜 
色*如果八张牌中有六张牌的颜色都正确地识别了，你会不会认 
为这样的结果支持具有心灵感应能力的说法？ 

这个实验的可能结果是四张红牌和四张黑牌八次猜剷的可能 
记录，我们想一下对四次猜测指定 红色的 方法数（黑色对其他四 
次> 就可得出样本空间中的点子数。 这只是 八件事物中一 次取西 
件的组合数 I 

n ⑸ :(:) = 70 ， 

假定全体70个结果是等可能的，并求正确识别六张或更多张牌的 
概率。 


为在颜色 上正式 识别六张牌，必须识别三张红牌 ，三 张黑牌。 
正确识别三张红牌有种方法，对其中每一种方法，三张黑牌 

) 识别的方法。所以六张牌的识别方法是乘积 ( ^)(^)-16 0 

由于正确识别全体八张牌只有一种方法，正确识别六张或多一些 
牌的概率是 g 。 


即使那个同道者是在猜测，要正确识別六张或多一些牌的机 


会几乎是25% 



9.6 按照 DuncanCl]， 到了本世纪二十年代，统计理 论才有 
效地应用 亍质蛋管理。 贝尔电话实验室的 Walter A.Shewhart 
开始这项工作，并在1931年发表 Economic Control of Qualit v 
Manufactured Product 这本书，在 1932 年 Shewhart 访问了 

伦敦以后，英联邦的统计质量管理开展得很快。虽然它在夷国的 
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发展迟缓了一些，但在第二次世界大战中却受到巨大的推动力， 
Duncan 评述*收抽样方案由 Dodge-Romig 的表一直到如今 
的发禺 # 

最简单的验牧抽样方案的方法如下，从一批 N 件机械制品中 
取一个 II 件的随机样本 t 如果次品数少于或等于一个指定的数 C * 
我们接受这一批,举例来说,在一枇 10 件的产品中，如果在一个容 
量为5的样本中我们发现三件或不到三件的次品，我们可以接受 
这批产品 1 

任何人可以想出一个验收抽样方案 t 下一个间题是确定所想 
出方案的特性或施行待征。我们应试行确定接受各批不同质釐的 
概率，如果一批 10 件产品中含有 4 件次品，什么是接受这批的概率? 

样本空间中的点子数躭是 i0 件事物一次取 5 件的组合数， 
( 5 °) = 252,有三个或少一些次品数的样本数是 

⑴⑴ 0(〗)+⑴⑴ C ) ⑴ 

= 60 + 120 + 60 + 6 = 246 ^ 

因此接受一批含有四件次品的概率是 H | = 0_976 # 


接受羝串 



• IQ 20 30 4G 50 60 ：n A0 90 im 


■ *•1 施行特征曲线 
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类似地,我们可以对含有任何次品数的批计算其接受概率，并 
绘出接受概率相对批中次品百分数的曲线，这样一条曲线称为施 
行特征曲线 <0C 曲线)，本节例子的 0C 曲线给出于图 9.U 


»*7由于导弹系统和太空旅行的发展要求赛常离的标准，可 
ft 性工程在过去25年中有了纵深的开发。假定三个电气部件串联 
如图汄2_ 


•A 



mm 


串联的部件 

为了使系统工作，所有三个部件都必须工作，如果部件工作的概率 
^ P a = 0*95, P ^ = 0 . 90 f 和1\^0¥卯，系统工作的槪率（可靠 
性>是(0 •的 >(0.90)(0 + 99〉=0.84645，提高系统可靠性的一个方 
法是构造一个并联系统如图 9.3* 这时系统可靠性是 


鬌入 



_出 


U 


Ss . s 并联系统 

P( I 或 I ) = P< I ) + P( I ) - P( I 和 I > 

— 0* 34645 + 0 * 84645 — (0* 84545)* 
= 0.97642. 

另一方面,我们可以用并联线路如图 9.4, 
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m 并联线路 

对图 9.4 中的系统，系统可靠性是 

P ( I 和 I 和 

但 

P ( I > = 0,95 + 035 -(0, 95产= 0_9975 

P< I >'0,90 + 0,90- (0.^0)^ '0.99 

P( 9 > =0.99 + 0*99 — <0*99> 4 = Q *9999 
因此系统可靠性是 0.9 S 743, 这说# 图 9.4 的系统较图 9*3 的系 
统更为可靠。 


9.8 我们常常有机会用简单的树呢明来解决槪率问题。我们 
将不对树形图作一般述，但将给出一个例子。 谭定我 们要求 
从一整副打桥牌鈿中神兰张而 悼好# 两张 A 的概率，竒以设 
想，牌是一张一张依次疮抽每次可能抽得的不是 A 就是非 A ， 
可能的结果可以想象为图9 •士中 的树，树枝 上所示 的概率是在前 
— ( 几> 次抽得的年作下的概率，所以必须验证，由底部爬到任一树 
枝的概率苟以把赤些 概傘相豳而得 # 囱地 爬 到 ㈡ 枝 1的概率可以 
求得 如下： ： ' 

1 I . - 

2 _ 1 

13 x Si K 50 ^ ~ Tl 3 )< 17) (25 ) 


三次抽取中恰好得到一张 A 的概率是樹枝4, 6和7的槪率 之軔， 
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a 树形曲牌的问理 

m 

9 . 9 总的谗来，应该指出,解一个简单陈述的概串问题可以非 
常困难，学生们可能会因初始的困难而感到沮丧，但不应该让这些 
困难阻碍在概念上所涉及的简单过程 • 

I 

I 

■ 

小结在许多概率 问麻中 ，假定_本空间中的点为等可能看本 
是合理的。于是一个事件 A 的概率只是 A 中的点子数被 S 中的 
点子数 n 除，即 P(A) = n(A)/n, 这一公式称为概率的经典定义， 
但它拫本不是一个定义。在这些问题中计算二个概率本质上是一 
个计数问雇。必须数出 A 中和 S 中的点子数。 

为了计算的目的，搀》和坦合公式是很有用的, 一 旦列出甚至 
部分列出 S 中的 点子就 会看出点子是摧列还是组合 * 




我们用几个例子来说明概率的计算，这些例子包 插坛子 问题, 
生日问题，超感觉力，质置管理和可》性理论 

树形 ffl 对求概率也很有用，特别对那些包含依次(序 贯〉 实验 
的问题 • 


参考文献 ; 
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习 ® 

H • • 

■ _ 

1+ 计算 r 人中有二人有相同生日的概本，设” 5，1^5, 20,2$,25, 
30>35.画出概率对^的曲线*在你的几个社交集体中， 何问他 于同生 
H 的人， ■ 结果是否与理论答案相一致7 

1做一次 §9.5 中所述的猜顏色的实验。你的实验数据*否支持心灵 
感应实验？ 

5* 对…， W 讨算84收概率以验证图 9 J 中的 OC 曲线 。 

4 _证0(上) • 
s •证明 ( v >( n )4 以 

e + 从一批 is 件产品中取二个四件的样本，抽¥收方粜是接收该批产 
品,如果四件的洋本中含有两个或少于两个的次盘， r 确定这一方案的 OC 曲 
技/ ， 1 

7* 从一副洗透的打持痒的辉中，随机地抽取一手13张牌 • 
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令 A 代表这一手牌冇两张 A 这〜率件。什么是 巧 
b t 令 B 代表这一手牌有三张 A 这一事件 0 PCB >? 

c . B 么皂这一手牌有四张人的溉率？ 

8. 继续习訝7, 假 定我们惑兴趣的不是整个一 手桥牌 的牌， 而是第 一 
张抽得的结果，第二 张抽得 的结果 ，等等 9 

a . 样本空间中的点子是组合还是排列？ 

b. 样本空间中有多少点？ 

..... 令 A 代表第一张抽得的牌是黑桃的事件，求 n < A > 和 

9. 假如图 9. 2中每一部件的可靠性是 0. S 9， 什么是这一系统的可靠性？ 

10. 在图9,2中那十个串联部件，每个部件的可靠性应是多少才能使系 
统的可靠性为 0.90? 

^ 11* 三个部件 A , C ， 它们的可靠性依次是 0.95, 0.90 和 0.99* 

怎样才能达到最大的系统可靠性？应该用图 9.3 的三个并联系统，还是用图 

9.4 的*件并联？ 

H — 个图书馆要求它的读者不®把他们用过的书插回书架。如果一 
本书是从一个排列着吋本书的 本架上 取出/'读者把它 I 随机地放砰到这一书 
架*什么是这本书在它应该放的位置上的 S 串？ 

1 S . 如果两本书(见习咒1 2 、觸杭地放囘到书架上*什么是两本书都在它 
们应该放的位置上的概率？ ’’ 

14. 龙--批邡件产品的两阶段验收柚样方案进行如下，先 柚一 个:?件样 
本彳如果没有次品*整批接收，如果有二或三件次品，整批拒绝，如果只有一 
件次品，再抽二件，如果 没有发 现新增加的次品，整批接收，否则拒绝*对 

求 OC 曲线 • 

投掷一牧硬币五次。 计箅有 两个或两个以上图?月上的概率^ - 
18. 住在一: te 滅市以外的一位妇女，驾驶她的汽车到最近的火车站，把 
汽车停在那里，坐了火车去城内观#歌剧，到了剧院，：啤想起能；记关 
掉她汽车上的前灯*如果如此，在她看完歌剧回到火 架站 的时候，她汽¥上的 
黄电池将会耗竭了。她估计忘记关_概单为0 + 9。她还佔计回到火车站， 
察看7下前订，哥及时地赶上看歌剧杓偶宰是0. 5 ,如果她希望有最大的概 
率能驾 i 蟫® 汽车回窣扣蔑观看了歌剧，她应 & 么做 ？ . 

P I ■ ' ■ ■ S 

17 ' 一个有自己住宅的人，他的割草机已用得很老了以致只要马达热了 
以后有时会启动不起手， 他箏剪 -n 次草地必须停止马达四次以清除机内草 
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斗中所积聚的 草， 在停止 巧达以 后而能再启动，其概率为 0.9, 并且修剪整片 
草地不烜映汽油的概率为 ( K 8, 如果他停止割草机足够长以便灌满汽油，这 
时能再启动的概率为17。他应否计划在某一次停机清除草斗时重溋汽油7 
13* 一位有汽 车的人正在考虑是否 要从一 本汽车零件广 告册上 去买几 
根火花塞线 ，据 他的判 断这些 新线将解决他的发火问题的概率是 H 如果 
不是火花塞线问题的话*他计划把车送往修理行去调整一下， 如杲火 花塞战 
值18元,调整一下要花80元，他应怎样做才能使他的期望费用 最少？ 

19. 喷洒一次一颗太的薄壳（美洲）山梭桃树要花9元，如果三次喷洒 
都在恰当的时刻，收获 S 将是100磅*如果有两次喷洒的时间恰当，收获董 
将是 6 J 0 磅；如果有一次喷洒的时间恰当，收获量将是30磅 | 如果不喷就没有 
收获。如果(美 洲〉 山梭桃每磅值二元 * 什么是 净收入 的期望餛。 







H 种分布 




二项分布 


16.1 构土工地奇事情， 

有能说*有不能 i 
… 突 然有人 来喊问 

诔是肉工母是罐？ _ .. ； : 

作为讨奋二翁夯希的出发点，钊用古波斯诗人；笼叙: | 金寧 
的< 鲁拜集 > 上一首诗①看来是合适的。 1 二垓逢展弁相±填華系败 
为 数学家 衍所知&经好百年了，井且一次再一次 ffe 被簞 k 发现 
以致看来 B 充法说清 4 谁磨陶 5：，和4政是磁'了。有的是，莪 
默#1亚谟他本人 W 能也軚悉二项式赓开和系数。.去给出二项式 
展开和系嶔的来源的一些迹象之前，我朽应诙封有关展开的； I 个 
亊实回康一下 *_ 、 

a 

r A ■ • ■ ■ 

■ 

10.2 在初等代数课程中，学生们知道 


和 


(a -f b )* = a 4 + 2 ab + b 3 


(a + b) 5 ^^+3a a b+3ab 2 +V 

把 Ca + b ) 3 的展开式乘上 (a + b ) fe 得到 

.(a + b> 4 = a 4 + 4a 3 b + 6a*b 2 4ab 5 + b*. 





到此可以促便学生们很容易记 f 2 产生展开式中各项的一些法则。 
好久以前就已见到每一璜的 指数和 是一个常銓。这就是说，如果 

Cvb ， 是 <a + b >" 展开式中的一项，： t + y 总等于^所需要的是 

| 


①-这首诗是 FiUgtrAld 的英； S： 痒文 [2] 转译过来的 • 


•舒 • 


系数的一个简率表示式，好久以前也 a 发现含 y 那项的系数是 
( I ), 它就是 n 件事物中一次取 x 件的组合数，于是二项式展开可 
以写成 

<a + b> ' 纪 ) 州 ” 

W_» B 斯醺三角形提供产生二项系数的一个筒单方法^三角 
的各行对 应着！ 1的不同值。每一行中.的元素翰是11那个值的展开 
式中各项的系数。这个三角形的一个引人注目的特性是，任何系数 
(1 除外)是它前一行中紧靠着它左右两个系数之和， S 此，对 n = 

3,我们得系数*1， 8.= 1+7，28 = 7 + 21，56 - =?1+ S 5 V 70 =^ S 5 + 

■ _ r . ■■: 

y，56 ^35 + 21^ 28-21+7, 8 卞 7 + 1, 和 JL。 

…据1呢 beii[ 4 , 页1似3,伽亚谟可能皁在纪耳1000午已经知道 

二硪汰展开 * 在演讲: 2 中，我们提请读者注意 Smith 的书，他追 

.溯这#的三角形是一位中国学者在#03年给出的 。 Eves [1] 指出 

— 项系数是 M ， Stifel 卒 I 544 年出版的著作 * integral 

中给出。大约在1 66 &年，巴斯噶 b 名宇与系数的三角排列牢固地 

结合在一起，虽然三角型式的排列也曾见于贝努里在1713年的著 
作 Conjeciandi n 

■ 

■ 

' I 

■ 

10，《 二项概率分布常常归功于贝努里 （例 如见 Kendall 和 
B«ckland[5]) ft 由于二项式展开的隐晦来源，它在概率中的应 

用却只有这样一个出处，看来不太可信。然而清楚的是，贝努里的 
确在概率问題中用过二项式展开。 

二项式展开是从考虑下述问题而产生的。做多 （ n > 次独立试 
验； 每次试验有两#可能的结果(一个成功或一个 失败八 在一次 
试验中，釋定一个成功妁概率晕 p , 什么畏恰好 x 个成功的概率 
哫？ 例如投掷一颗骰子五 <n = 5> 次，什么是确好三 (x 个四点 
的概宗呢？十次互斥事件连同有芙的概率都在表10_1中给 出。 
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按照这样的推理，我们可以总结说 n 次试验中恰好有 x 次成 
功，其一般公式是 


①表中的代表不是四 

表 W ，1 中每一行有相同的概率。如果我们能确实知道行的数目 
就无需列出这些 事件， 容易见到行的数自就是从五个可能的位置 


恰好三个四点的概率就足出现三个四点那几个互斥事件的概 
率之和 • 因此 


p(x = 3) 






表10+1 二項帙牟的实例说明① 




试 验 


寧件 


2 


S 


6 


事件的概率 


* 


是 

率 

溉 

的 

求 

要 

所 



m 


5 3 


5 3 


数 

法 

方 

的 

个 

三 

择 

选 

中 


(x 

p( 


J J f fl i t p i 3 J 
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11 H -in 41 I 

/V fv 
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ft 4 • 4 4 A 4 4 4 
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M 4 s i i s 4 4 


4 ■ 


4 4 a 4 4 & 4 


a a 


4 4 4 


a ft • 
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其中 



q =卜 p * 

读昔很快会注意到这个表达式很象二项式展开中的一项。事 
实上，它始 (P + < O n 这个二项式展 5 F 中的一项 6 由于这一原因，它 
称为二項概$分栢，筒称二项分布。 

还应指出\可以诏演讲 9 中的树形图来得到二项溉率公式，树 

将有个分支，而 X 次成功的概率是与< = 2分支有关的概率之 

和* 


10,5二项芬布表已经有了好多年了 •表 A .2 对 p 的几个 
值 ， n = 2,…，10给出二项分布的值,例如，可以直接从丧上读出八 

次试验中三次成功, p = +的概率是 0,2731* 如果我们投掷一 颗骰 

子八次，在三次投掷中得到一个一点或者一个二点，其概率是 
0.2731。 

■ 

10,6 Gridgemaii[ 3 ] 应用二项分布来分析为什么 一 个有 11 
个小孩^一一先 5 个女的后6个男的是一件惊异的事。他提到这个出 

现于“生命科学丛书”的例子作为具有概率^的一个很罕见的组 

合。如 Gridgeman 所指出，任何有11个小孩 (不论 男孩和女孩是 

按什么指定的次序出生）的事庭都恰好有相同的概率 

ZU4o 

在已知 n 个小孩时，5个女孩6个男孩(:数目倒一下也一■样） 
是弁不奇怪的，因五六组合比其他组合更易出现。然而，己知5个 
男孩和6个女孩，那么先 5 个男孩后6个女孩或者先6个女孩后 
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5 个男孩，其槪率是^-=这迠一件不大可能的事件，但 
其机遇却大大地高于 


10 + T 演讲8中描述了一个猜颜色的实验，并给出正确识别六 
张或见多张牌的概率是设想这个实验重复 TW 次，正确识别六 
张或更多张牌占10次中的 S 次。这一情况奇怪吗？按 n = 和 


我们要求 P<x = S ) + p( X = 9) + p(x = 10)， 因为#几乎等 

于 ( K 25， 浩表来求此概率，我们见到它近似于 0.0004 + 
0 . 0000 + 0.0000 = 0, 0004,当然这类的成功是如此不可能凭机会 
出现使它能给思想上尚设想以有力的支持。 


10,8均数和方差很容易用代数的方法求得为 

■ • • 

M = np 
<7* - npq 

如演讲6中所述，这些矩也符合我们直觉的理解，均数是成功的平 
均数或期望数，它恰好是试验的次数乘上成功的概率 。在很 多情况 
中，这一计算几乎桌下意识的。如果我们投掷一枝硬币九次，我们 

会说图朝上的期望数是|， [ np = 差可没有这样直 

观。然而由表 A .2, 我们见到方差随着 XI 的增加和随着 p 趋向于 
二分之一而 増加， 略一思考就会使我们相信 p 和 q 应平等地进> 
方差公式，因此表达式 npq 是合理的。 

为了掊出代数推导是怎、样进行的，取:频单分布如下， 


X f 

0 

a-p)* 

X 

2pa-p) 

2 

p* 
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于是 


= 2p(l— p> +2p* 

= 2p 

<y a = <0 — 2p)V + (i- 2p^2pq + (2 - 2p) a p* 

= 4p a q 2 + (1 - 4pq>2pq *5 - 4p 2 q a 
* 2pq<4pq + 1 -4pq) 

10.9 我们己经阐明二顼分布是如何由以前几次演讲中的槪 
念产生的，给出它的几个特性，并说明在计算中它的应用，千万不 
要误认为它只是摸纸牌的实验中有用，二项分布的知识在遗传学、 
抽样验收、可靠性和许多其他场所都有应用9 


小结二项分布的名称是从熟悉的二项式 （ a 的展开得 
来的。这一展开的二项式系数具有形式 ( = 

当进行 it 次独立试验，每次试验可能的结果不是成功就是失 

败, 并且成功的概率是一个常数 P ， x 次成功的概率为 

PDc 次成功 ] = (^)p K 0-p>^% 

这就是二项式0 +幼"展开式中的一项。 

二项分布的均数和方差分别是 tip 和 npCl-p), 

对于大的 n , 二顼概率的计算变得很麻烦，但这个分布的表和 
袖珍计算器消除了大多数的麻烦。 

我们举了好几个例子以说明二项分布， 
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习 题 

K 钲明二项式 <a + b 4 的下列四个展开是等价的 

a . ⑴ a 〔v + ⑴ a V + 

b. (®)a'b° + (5)a J b' + (*)a>b^(^) a «b» 

c . ⑴聲⑴ a , bJ + ( S ) a 2 b ,+ ⑴心。 

d. G)a_ + ( 】 )fbi+(5) a *b 2 + (2)W 

2, 建立 n = 2, 3* .”， 〖0的巴斯噶三角形并指明每行所对应 tt 的特 
殊值^ 

夂 构造一树形图以描述四次浊立试验的可能结果的序列。指明各树枝 
所对应的零次成功，三次成功和四次成功。 

^投掷一枚硬币 十次。 应用二项公式求恰好五次图朝上的槪率，应用 
表 A .2 计箅至少欠图朝上的概率 # 

5， 一学生没有准备便去参加一次考试 • 他猜测全部 10 个是非题 •什么 
是至少猜对八题的概奉？ 

6. 投掷一颗骰子六次。什么足恰奸得到一个六点的概率？ 

7 投掷两颗骰子六次。什么是恰好一对六点的 概率？ 

8 某―图书馆打百分之十的书从未出借过如果你从此图书馆随机地 
选取五本书，什么是至少有两本以前从未出借过的概丰？ 
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s . 在一个卖验中一位有异常 a 察力的人试阁 獪剜分 发戒牌（知演讲9 
中所描述的)的颜色。这个实验 H 复十次。准确指明的纸牌数*心6, 4, 
6, 2, 6, 4, 6, 8和心作概率计算以判别这:些结果是否支持思想上灵感 
性的想法。 

10. 众所周知，具有给定周长的矩形中，正 方形# 最大的面积。应用 
这一结果证明二项分布的方差在 P = j 时为最大，为什么一个二项 变置的 

变异在 P = | 时为最 X * 直觉上合理吗？ 

11. 在10时，画出二项方差针对不同 p 的曲浅*注意最大的方差 
f 出现于 

12. 已知一个四个儿童的家庭，列出按性别的一切可能序列。什么是 
最可能的女孩数？已知有两个男孩和两个女孩，什么是两个男孩之后跟随 
着两个女孩的槪率7 

13. —次考试包括10个多神选择的问题，每一答案有三个可能的选 
择。如果每一问躬只有一个正确的答案，什么是凭猜测在10个问题中至少猜 
对的概率？ 

14. 一个园丁神六堆帟瓜，每一堆下了六颗种子，如果种子的发芽窣 
£0.95，什么是全体六堆由每堆至少长出一枝南瓜苗的概率？ 

15. —家邮购商店装运散装自行车。装运检査员作一次最后的检査使 
明确所有的另部件都包括在内 & 如果一次齐全裝运的概率为0.的，什么是 
一个月中所装运的1000辆自行车全部齐全运出的 概率？ 

16. —千个部件串联在 一起， 如果雯求系统可靠性为0.&9,卄么是每 
一部件所要求的可 II ；性？ 

17. —位妇女热心地参加每一可能的抽奖竞赛 * 如果嫌得任何一次指 

定的抽奖赛的机会不会大于一百万分之一，什么是在一千次中至少谅得一 
次奖的概率？ 

18 . 当 n = 10和 p = 0.5 时，求 

ft* Pt**-3<r<X^ + 3o-> P 

b, 十 

C * i - a >* 
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19 . 验证 X/fl 的均数和方差是 P 和 pa- p)/n. 

20. 设 n = 30，求 X/n 与 p 相差不大于 2 i / p ( 1 - pjA /7 在 p = 0 .] ， 

OJ ， …，0,9的槪率* 

21. 为了研究学生对改变宿舍规則的态度，在学生中取一随机样本。務 
望做 到赞成改变的估计 X / n 与真正的分数 _ p 相差不大于0.0%问样本应 
取多大才能2获得这样大的误差的槪率为0,95? 
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演讲 11 


正态分布 

TM 正态分布是用得最多的概率分布，我们已在政治箅术, 
赌场和频数分布等几次演讲中简短地遇见过它。很自然会有浓厚 
的兴趣去追溯它的起源*因为这个分布常被称为*斯分布，可能 
设想它的起源应归功于高靳<1777~1855)，然而这一分布早在高 

斯诞生之前就出现，要给正态分布确定一个初次发表的年月， 
Walker [7, 页 4] 十分强调1733年十一月十二日 * 

11*2 在十七世纪的后半叶，贝努里 （1654 〜 1705) 开始写他 
的 Ars Conjectandi (猜想术、这一不朽的分成四部分的著作足 
在贝努里死后八年的1713年出版的。在第四部分,贝努里关心于 
人们投掷一枚不均勻硬币多次，能确定圈朝上的概率到多么准确 
的程度，贝努里证明了只要投掷足够多次，概率可以确定到所需 
要的精确度*这是 大数定 律的一个初等形式，即 X/II 在 II 趋于无 
穷时将趋向于 p (可以 按精确的方式）。 

11*3 德莫哇佛 （1 防7 〜 1754) 在做贝努里提出的问题 时发现 

了二项概率的一个近似公式 • 这一公式看来就足正态分布的初次 
露面。根据 Walker， 这一公式可能出现于1721年，植第一次为德 
莫哇佛用文字写在一篇七页长的拉丁文论著内是在1733年十一月 
十二曰。它的标题是 “Approximatio ad Suramam Terminorum 
Binomii a + b" in Seriem expanse . 这一公式后来发表在他的 
著作 # 1?0价1.恥 of CAcMie 從**的第二和第三版 <17 38 , 1756)^', 也发 

表在 Nl/kcei/anea (1730) 的某些版本内 & 皮尔逊 [6] 在 
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伦敦大学学院的图书馆内发现这个小册子的一个拷贝，并叫人们 
注意德莫哇佛显然是正态分布的创始人 。 AdamsCl ] 承认德莫哇 
佛是获得正态分布的人，但他怀疑德莫哇佛母否认识到正态分布 

按它本身的特性来说是一个分布 

■ 

11*4 正态分布的统计应用开始于数理天文学家拉普拉斯 
(17 祁〜1於7)和高斯 (1777 〜 18 SS ), 给出概率（曲线下的面积)的 
第一张表是法国物理学家 Kramp 于17卯年所发表的 f 它是第一 
次被比利时统计学家 QuetektU 796 〜用来描述物理科学以 
外的数据。这个分布釋一次在 1 S 郎年被皮尔逊称为正态分布，直 
至今天极大多数人仍沿用这个名称， 

a 

a 

； 11*5 为什么这一分布能如此吸引十八、十九世 纪科学 家的想 

象？高尔登[ 3 ]极为感动地说 t ，据我所知，几乎没有任何东西会 
象宇宙秩序可以用‘误差频数律^来表示姐惊奇艰式那样给人以深 
刻的印象' 

正态分布只是^条钟形曲线<或一族钟形曲 线〉， 由来源各异 
的数据的直方图拟合而成。实际上，典型的正态曲线在顶点比古 





P 11. > 正态曲浅族 
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钟軍尖，但通常都称它为钟形，而我们也就沿用这样的描述。 © 


线的方裎是 


f(x) = 





其中 X 在 - CO 到+ CO 中变化，而 M 代表均数，浐方蜜， ® 11,1显 示 
出不同的 P 和 cr 的影响。均敖增加，整条曲线向右移动，方差增 
加，曲浅变成平坦，下跨更大。 


11.S 新近一条电视新闻报道了一个十岁男孩在一次智力商 
数 (〖Q) 测验屮得分166，以及他的父母如何努力为他寻找合适的 
特殊教穿。如此髙的 IQ 分蚊的意义是什么呢？一般认为 IQ 分 
敌站按照正态分布分布着的，虽然广大群众付 IQ 这个词比对正态 
分布这个词更熟悉一些。 CohenLZl 追搠智力测验的 S 展由十九 
世纪九十年代高尔 S 的想扯到二十世纪七十年代有关 IQ 的法 
律诉讼。 M —很好的描述给出干“生命科学丛书”中名为 rte 
的那一卷内《]。》 力商轚 这一名称，简写为 IQ， 是美国心理 
学家 Lewis Terman 创造的。原始的想法是试图取得智力年龄对 
时间年龄之比；因此芎 f 商数洁个诃，虽然分数已不再如恥确 
定，但这个名词却保持了下来。 

实萍上有许多种智力测验和适宠性测验在尼 ； 大多数澍验的 
分 S 被认为遵循具有指定均致和方差的芷态分布。对很恣神觊验 
分数，包括陆军分类统考 （AGCT), 大学入学考试会 (CEEB) 的考 
试分数， Stanford-Binet 智力商数分数和 WechsUr 智力商数分 
数， LymanCS.-! 作了讨 i& 并给出了一个转换表所有这些都 遵循 
正态分布，其均数和准差如下。 


分钕 

均纹 


AGCT 

100 

20 

CESB 

&00 

100 

Stanford^ Bi net 

1D0 

16 

]0 

too 

IS 
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那个十岁男孩在 Wecbsler IQ 测睑中得到 I 66 分是很高的 
分数,因此是在一组被楮选出来的少数儿个之中，我们现在要讨论 
如何应用正态曲线来计算嫌率， 然后可 以说166分真正是多么杰 
出的一个分数。 


11.T 概率是用曲线下的面积籴表示的，因此X 在4和6之间 


的概率 P(4‘X<6> 是由曲线下 4 至 6 之间的面积所给出。曲线 
下任何指定点上的面积为零，因此X等于任何给定值的槻率为 
零。这一事实使很多学生困惑不解,然而却很容易解释,只要注意 
正态分布的曲线是一条近似地代表一个大的总体的曲线。在一个 
相似于正态曲线的大总体中，得到一个确定值的机会，如果不是恰 
奸为苓，一定很小。 

正态曲线下的面积有许妻种表,在表 A *3 中臧 们给出皮尔逊 


和哈特莱所编的表。 ; 这些表给出只= 0, （7=1 的 P〈X<x) 之值， 
和 (7=1 的情况 称为榇 准正态分布，通常以2记标准正态变 


量，在以后我们将坚持这一习惯。 

应用这个表和很少一点的劳动，我们可以求出曲线下任何所 
筘要的面积。画一张简 M 显示出已知的面积和所需要的面积有时 
是有帮助的。还要记住曲线关于零对称，我们可以十分象小学中 
解决“饼的问應”那样来求所需要的面积。 



n n s 应用疋态表 

WB 什么是 P( — 由图 ii_2 中的简囝可以见到 
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P(-1.5<Z<1)« P(Z<1) - P(Z 成 -1,S> 

= P ( Z < 1 ) -〔卜 P ( Z < U 5 )] 
= 0*8413-0*0668 
=* 0.7745, 


11*8 标准正态表的真正用处在于同一张表可以用来宇任何 
正态曲线下的商积，不管 /* 和 a 取何值 # 其秘密在于先把变量标 
准化。1这只要先减去均*再»以标准差就可完成，用符号，这意味 
着 ( X - ZO / or 是一个标准正 态丧量 _可记之为 Z , 掌握了标准正 
态表的使用，便可通过标准化 X 以求正态曲线下的面积，假定我 
们要求 

P < a < X < b > 

从每一項中 减去# 再除以 a , 所要求的概率变成 

p (乎切 

\ a a / 

例題如果一次标准化_验的分数遵循均数为100、标准差 
为 ]5 的正态分布，问位于恥和1邡之间的分数要占多大份额？ 
答案是 

P <85< X <130 




85,100 
~15 


< Z < 


130 




P( ^1^Z<2> 


0*9772 ^0*1587 = 0.8185, 


这一答案的图解法见图 1 U 3 



«5 100 130 -1 0 X 
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■ n . i 标准化分败所占的份額 




盈要的是学生要学 会使用 标准正态表，建议学生学会使用图 
n *2 和11,3中的简图。 

回到 IQ 166 那 个十岁男孩的情况，我们或许要问总体中有多 

大的份额有更高的 IQ ? 这就 是说，我们要求 

P ( X >166) 

从分数中减去 P = 100,再除以 a = 15使分数标准化,便得 
/ P ( Z >4*4) 

从表 A ，3我们求得这个概率小于 0.00003. 因此总体中只有极 

少几个有更髙的 ICK 

11.9 正态分布不但对 IQ 分数 * 还对许多其他广阔来源的数 
据提供适当的描述。很多由度量过程而获得的数据都是遵循正态 
分布的。 

小结正态分布 在十九世纪前叶甴高斯加以推广，所以通常 
称 为高斯分布。 皮尔逊是第一个称它 为正态分布并 指出德莫哇佛 
是创始人，但它仍被称为高斯分布。 

这一连续变量的分布是一条对称的钟形曲线，具有方程 

总体常数，即 参数， A 和 <7 a 全面地确定这个分布4 

标准正态 分布， 即均数为零和方差为 t 的正态分布，曾被编成 
巨大的表，这样的表，通迸变 量的标 准化， 可 以用来计算任何正态 

I 

分布的概率 6 标准化 包括先减去均数然后除以标准差。 

IQ 分数和许多标准化测驗普遍地被认为服从正态分布。此 
外 ，按曲 緯打分，其拥 賒分数是正态分布的 • 
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习 題 

1 . 如果从 - 正态分布随机地取五个观察值，问至少有两个观察值大于 
只的 概率是多少？ ^ 

2. 应用衷 A .3 ’，m 

a + P ( Z >1,5>, 

b . P ( Z >1*64>. 

C. P(Z>1.645>* 

d . P(-l ♦恥 < Z <1.96>. 

e. P(-1,645<Z<1.645>. 

3. 若办 = 100 和 <7= 20，求 P < X >120). 

4 . 若 I * = 500 和 < r = 100,求 P <350< X < a 00>_ 

5 . —位讲师采用& “肋线打分法' 在一个分成好几个组的课程内，学 
生的分数 S 來遵谭 均纹为70和标准差为8的正态分布。如果这位讲师愿意 
给百分之10的学生 A ，问 A 和 B 的分界线应该是什么^ 

S . 虽然书上的表并不包栝大的值，问之位于6和9之间的概牟大约是 
多少？ 

I 

t 设一次智力测验的分数服从均数为100,标准差为16的正态分布 f 如 
果我们仅给参加脚验的人的0. 5 %队天才的称号，那么一个人应得多高的 
分数才能取得这样高的称号？ 



ft. 应用表 A . 3,取水平轴为 Z , 铅直轴为积聚钯串画一曲线阁。 

3. 如果一位学生的标准化 CEEB 的分数为 1 . 2 ，问他的原始分數应 
该是多少？ + 

10 * 若辟 = 120 * 且 <7=15，求常数0使卩<-(：<又<(：)=^,5, 

11. 若#= -]50,且 cr :=15, 枣常数 c 使 P (- c <? C 今 c ) = 0.75。 

12 . —种治疗奥塞的_浆*广告宣传所含酒精百分数为1+4%.制造过 
择要求酒 伊百分 数遵循抅数为1.4%和标准整为 0 , 1 %的正态分布 * 求一 
批产品中洒精百分数超过15%的概率/ 

13. 一种早餐用的谷类食物舞按14英两包装和出 售知。 据运输检验员 
详尽的分 W， 实际重 S 是一个标准差为英的正态随机变置。如果重 
董轻子或等于英两^钽装占总包装的 H 问 U 英两 ft 装的平均童曼是 

什么？ ’ ■ , 、_ _ 

- - 

■ i 4 . 一个人被告知他巳超重，因为在他的髙度，拇的体重应在 i 32 和 
英砑之间,如果体重是一个正态 变霣， 并且95%与他屏样髙度的人有 
体兎在上述萆围之内 I 问平均重犟大约是多少？ . 

—个电气系统有十个串联的部件。只要这个佘‘中有 7 卞知件它 
的电压是在工程规定的100〜130伏之间，每一部件都芷锖运疗。备每一钸 

件的电 压是厂 均数为 11S 伏哥标准差为 5 伏的正态变置，什么是这一系统 

—批发商行对某一商品每月所收到的定单數是 ntl <30, < J 00 m p = 

◊ 的二项随机变董，商品的批发价是每件 IS 美元， i + 算毎月总销售额的 

均数和方差，把毎月总销售额当作一个正态变置，近似计算月总销 售额® 
过650,000美元的槪率， 

n . 点绘* 1 = 10 ,|>= 1 0 > 0 的二项概率/然后用区间- 0 . 5 到 0 . 5 ， <) > 
到 1*5 等作一直方图以表示二项分市 。 .. 1 ■ ：■ 

13. 用正态曲线下由 3. 5 到 1 5的面积来近似习题17中 X = 4 的二 ® 
概率 • 在正态曲线中用5<即 up ) 为均款， 2 . 5 [即 ap < l - p )] 为 方差。 

C 
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演讲 12 


普哇松的指数极限 

12-1 普哇松 <1 M1 〜 〖84 0> 在巴黎的科技大学担任主考导师 
Qxamhier) 和教授近四十年，并在数学、物理及天文方面写了三 
百多篇文章。虽然他最著名的著作是 rraiG de Mechanigueimih 

但他在概率和统计中却由于普哇松分布而更为知名 * 他在18 37 年 
给出普哇松分布作为二项分布的一个极限 Q 二项分布的普哇松指 
数极雍 [6] 看来比德莫哇佛所得到的同样结果出现得早。 David 
[ 2 ]指出，德奠哇佛在 ma 年的著作: rfc c& 仰 ce 的 

第一版 中第一 次给出二项分布的指数极限 。 不过，这个分布仍被人 
称为普哇松分布。 

12*2 有一点组合、极限和 e 的定义的基本知识就能获得和 

■ 

德莫哇佛和普哇松同样的结果。为了深刻理解普哇松分布和正态 
分布，对重要的数学常数 e 有一基本的理解诘必耍的。 e 的定义 

是 

e -lim (l ♦ 

容易看出这一定义中所要求的极限过程。我们来箅出这极限.序列 
中 的几项 

(1 + =^,00000， 

(z ^2,25000, 

(1 + 士): ==2.37037, 
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'(- 


2.44141 


+— ^-) 5 =2,4 m 2 


继续这一过程，可以计算 e 到任何所要求的精确度。到五位小数, 
e 有值171828。这一计算在大多数的计览上是特别方便的。 

为了获得普哇松分布作为二项分布的一种极限情况，我们需 
要另一结果 


化( 1 + 子) 


0 


这一结果也能在计算器上用数字来验证。 


.12*3 了解了 e 和6我们可以进行下去，求出当 II 趋大 ， P 
趋小使得乘积 0 P 为一常数时二项分布的极限形式。首先，.写出二 
项概率函数为 


f<x) 


其次，注意到 


ni 


pVl - pV ' 


ni = — 1 )( 0 -2>.x + l>(n-x> … （ 2>(1> 


卜 =11(13 — — … （n 


1 Kn - x)J 


于棘 


f — -1)“亨 丄 n-x + l 〉 ♦ ， 


然后以 X / n R P (因为 np ^ JO 便得到 


f ( x ) 


u(n - 2 ) … （n — x + 1) 

- xP ~ ： ~ 

n(n，lKn -2) .“ <ii ― x +1) 
n ( n )( n )^*< a ) 


(七 )\ 




现在考虑当 n 无限变大时将会怎样，第^项趋向于1，而剩下'来的 


是 


lim f ( x ) 






lira (卜 


r 
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现在，当 ii 无限趋大， n - x 也无限趋大，因此 

1[m (卜丄 y' lim (卜 丄)> 

最后，我们得到用指数表 m 二项极限的著名结杲 

f { x ) =- X = 0,1 ， 2, … 

这一分布称为普哇松分布,很自然地，由于 n 是允许变成无穷大, 
x 的可能值是由零到无穷。 

12-4 普哇松分布的矩特别容易求得，并是大家所熟知的。值 
得注意的事 实是， 均数和方塞都等于常数 (或参 数 > X ， 为明确起见， 

1 这一结果作为二项分布的均数和方趋的极限性质可给以一个直觉 
的验证。当 II 趋大使 tip 为常数，即 P 在 II 变大时变小，于是 

lini np = A , 

lim npq = lim 入 （1 — p > + 

12 5 普哇松分布曾 被编成 大的表，表 A .4 给出 x 由 0 到 24 

的 f ( x ) 值，例如，若 X = 3_&, f (3) = 0.2046。 若 A =9.0， f (3) = 

■ 

0*0150。 

■ 

12*6 Bortfciewicrn] 在 1S98 年给出一个应用普哇松分布 
的经典洌子，但在今天看来有点怪诞不羁^他出被马 鵾死 的骑兵 
人数， Bortkiewicz 的部分数据曾在演讲5中提出过（见 FUz [3：|>。 
取10个猗兵队，观察20年，共得200个£录。考虑此200个 

i 己录中所报告被马踢死的人数 O ) 和每一个报告的 r 值的頻数 。表 
】2.1给出 Bortfciewicz 的结果。 

在200 个记 录中，109个报告没有尺被马踢死个报告有1 
个人被马踢死，等 等。 
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*72*1 被马碭死的竹兵敖岭须孜分布 


r 

频故 

相对频数 

理论慨率 

0 

109 

0 + &45 

0.544 

1 

65 

0-325 

0.331 

3 

22 

0-110 

0.101 

3 

5 

0^015 

0- 帕1 

4 

1 

Q -005 

0.003 




从数据中得到样本均数为 

(0)(109)- K 1 X 65) +(2)(22) + (3)(3) +(4)(1> 

： 200 


= 0.61 


然后把从数据中所得到的均数用作衹率分布中的X，这就给出方程 


f ( x ) 




x! 


它就是演讲5中所介绍的并可用来计算理论槪率。这些值也可用 
表 A*4 中 X = 0.6 的相以 值来近似。 


Bortkiewlez 的数据很好地由普哇松分布所描述。我们现在 
对这一特殊例子的兴趣纯粹是历史性的。然而，容易设想这一例 
子所产生的普哇松分布是一个二項概率的极限近似。一个骑兵在 
一年中不是被马踢死就是不被马踢尧。合理地去假定这一稀有事 
件发生的机会对所有的兵士来说都是一样的，并且兵士们被靨充 
的机会是独立的。因此一年中被曳死的骑兵数是一个二项变量，但 
强，掖踢死的概率 P 很小而试验次数即骑兵人数是很大，因此#哇 
松极隈对这些数据给出一个很好的描述 


12.7 Student” 在1907年发表另一例子 [7] 用普哇松分布 

来描述真实数据，他还给出二项概率指 数极限 的推导，但没有提到 
普哇松或徳奠_佛。 A Sfudent r 给出散布'在一张玻璃片上一薄培 
液体中酵母细胞个数。表 12*2 给出400个4、面积中个数的頻数。 
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衷 12^2 'StiKlenp 时母細胞敌托 


r 

頻数 

相对频数 

理论槪率 

ft 

213 

0+5325 

0.5G5 

I 

128 

0.32 

0 + 34S 

Z 

37 

0.0935 

0*1175 

9 

18 

0,045 

-^.0275 

i 

S 

0.0075 

0.004C 

5 

■ _ 

X 

0-0025 

o.oooe 


+如同被马踢死的数据，我们可以得到样本均数 i =0.6825。以 
此值为 M 可以得出理论概率，并且见到普哇松分布做了一个很好 
的描述。也可用表 A .4 中? 1 = 0. 7的相应值来近似这呰槪率^希 
望学生们能读一下这篇文章看普哇松分布是如何作为二项概率的 
一 个极限形式产生的。 

)2.8 MulUt [5] 应用普哇松分布去描述 U 73 〜1974季度每 
一队参加全国 曲棍球 联赛胜 或负的 打门所得分数 ，例如 ，波士顿队 
在它自己场 地上的 比齊中平均打门得分4,95。表 12*3 显示出每次 
比赛打门中的频数分 布连问 mX = 4.95 所算 出的理论概率 & 这些 
概率也 可用表 A . 4 中 X = 5.0 的相应值很接近地近似。 Mullet 认 
为由于每次打门中的就象普哇松分 布中一 个随机 观察，曲 棍球赛 
是很容易预测的。 


«■* 总的说来，普哇松分布可以用作二项槪率的一个近似 
(大 a 和小 fO ， 并且凭它本身的特性也是某种类型计数数据的一 
个分布，诸如在一给定的时间内所释放出放射性粒子数，在一给 
定的时间内所收到的电话叫唤次数，在一给定的时间内设备的失 
效次数,和甚至一年内被马踢死的骑兵数， 
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m 2 .菖波士铕队技客队的打门辛的教 


r 

频数 

相 对顿敢 

理论概率 

0^1 

l 

0 + 0£5 & 

0.4421 

2 

3 

0.0513 

o-ms 

3 

5 

0,1282 

urn 

A 

9 

0.230S 

0*1772 

S 

10 

0^2564 

0,17S‘ 

6 

S 

0.12S2 

0AU7 

7 

2 

« ■ 吋 13 

0- 1023 

a 

3 

0.0769 

0.0633 


1 

0*0356 

o.om 

>10 
# _ 

1 

>• 

0_ 似 5« 

0+0303 


小结，普味松分布，象正态分布，首先为德莫哇怫所得到/而 
:减常 却把功绩归于他人,这里归于贅哇松， l 

把常数 e 理解为当 n 趋大时 (1 + 1 /nV 的 极限,就能得到二項 
分布的极 KL 当 n 趋向无穷，而1>趋向零使得 iip ^ X 时*二项分 
布的极限是 

f < x > W/xf . 

普哇松分布的均数和方*均等于 X ,这是一个相当怪异的情 
况，但它可以用 II 趋肉无穷, np ^ JL 时的二项分布的极限来验证。 

普哇松分布也被编成很详细的表，并且用来描述稀有事件的 
概率诸如被马踢死的人数,雷电火花和设备失效，等 • 
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习 题 

1 用计算器计算 [l + a / n)] ft ，n = 6,7,8,9，10, 这一序列是否看来向 
所说的值收敛？ 

I ， 用计剪器的 e 键计算必其次，计算 「l + (3/ a )]"， …10。 
这一序列是否向 e 3 收敛？ 

5. 对 ttt 50■和 i > =0.1 的二项分布， 4 t 箅 3 C = 0,5,10， U ，20 的概率，应 
用夂 = up = 5的普哇松公式， 铎算 z 1 0, S , 10,15,20的概苹广比较普哇松概 
: 率与二项概率《 

4. 用表 A .4, 对\=1,3,3,4，卜计算至少出现5次的概率& : 

5. 用 A 等于 0 J 1 之值，计算 Bortkiewiu 数据的 rt 理玲概率％在同 
—张曲线图纸上插绘观察相对频数和理论概率 & 

e . 用 \ = ( he 3 25 之值，计箅 1 ^ tud 明 r 酵母细胞数据的理论概率，在 

_ I ■ T T 

同一张曲线图纸上掸绘颯察栢对频数和理 i _& 嶼率的曲线。 

r 找一组可改很圩埤用普哇松分布来插述疫 _( 傍如持续叶问， 
交通事故数，撖 齒的许 被，灾害性暴风雨次数，用焱 遍的 均数作为 X 
的值，计算理论频数并与规蔡到的相比彳 / ^ ： t 

L 用彳 .95 作为 X 的值，计算表 12. 3 曲棍球比赛打门中的数据的理论 
概率,在同一张图纸上点给观察相对频数和理论概率。 

3. 点绘 b 纟， 2 ,…，10財的贄哇松概率函教^ 

10 r 用分组- <>• 5到0.5, 15到1,5，15到2 ■ 5等的盍方^来表示;^ 

10 的普哇忪分布。用均效为10 方差为10 ( 即 4) 的兵态分 市下的 




面积近似 P(X = 8)( 中心在点8上直条的面积）。 

11+ 用普哇松分布计算演讲10中习阴 15 的二项概宰，用 A ^ np 9 

12, 用普哇松分市计算演讲 10 中习题 17 的二项槪率。 

13, —个市办发电厂具有对市中某些部分输电中断的经验9 一个新工业 
考虑在市内建立 t 套新设备，但关心断电的可能性^ 一年中输电中断的次数 
看来象; I = 6的普哇松分布 4 问一年中不多于二次断电的概率是多少 T 

14, 一家大的山核桃果园经理有一喷药计划以控制山核桃象*虫繁殖。 
每颗树上山核桃象奧虫数是一个参数为4的普哇松变童。他计划控制象鼻 
虫的繁埴使得每赖树上象鼻虫不多于50的槪率为0.95。问每颗 W 的平均象 
鼻虫数应是多少？ 

15+ —大学的物理工厂经理对大学电话线路的饱和状 态发 生忧虑，并在 
考虑添设几条专为意外叫唤的线路。如果一小时内叫唤次数达到20,000次 | 
办公室的电话系统就认为饱和了。问最大的 J 能是多少使得叫唤次数不 g 
过£0, 000次的概率为0 . 95?应用正态近似以求出答案。 

16, 一队飞机的设备问题要求有一新的维修计划。任何一架^机在250 
小时操作中遇到三次小臃碍就应怍一次全面维修检査每1000小时的操作 
中设备发生障碍次数是一个参数 A = 10 的普哇松变置，问一队飞机经过 250 
小时操作后有多少比例的飞机将期望有一次全面维修捡查。 

17. —汽车驾驶人一月中在她驾车上班路上因被认为在交叉路 n 闯红 
灯而受到第三次违章处分，因而怀疑交通灯工作不正常 & 她做了一次个人的 
调*研究并认为在绿灯时所允许通过的汽车数是参数 J = 3 的普哇松变量，问 
守候在路口的第一辆汽车违反交通规章的概率是多少 T 第二辆汽车？第三 
辆汽车？ 





大样本和小样本 




演讲 13 

■ 

抽样分布和抽样调查 

M .1 口讲或足述一切悲伤字句中，最悲伤的要舁：“恐怕 
会， 

Join Green leaf WJiUHer 

在演讲 i 中多汝 提到早期的人 a 调*和人 口肩査 方法 ^ 人口 
镧査方法的近代发展是审慎地应用抽样 c / 在1970年，美国人口和 
住房溽査中大多数的信息是用抽样来收集的 C 见 Procedural His ， 
tory t 1970 Census of Population and Housing ) ^ 对人 口中年岭、 

性别， 种族、与户主的关系和婚姻情 》 等项目采用全商调査的方 
法、对人 P 的大多数其他信息，基本样本是一个20%的样本》对有 
些项目取一个更小 的样本 P 

我们几乎每天会遇到阳光下每件事的民*澜 II 的绪某 。 这些 
民意澍验为广大群众所接受的， 虽然也 留着一些撻贵的怀疑 一 
可能是由于一些失误，例如预测1936年兰登将战胜罗斯插、: L 94& 年 
杜威战胜杜鲁门等民意测验的可悲的结果。尽管人们普遍地接受， 
伹由一 个样本取得正确的绪论总似乎伴随着二点神秘,^我们希望 

解除某些抻秘性 t 为此，我们将仔细考患一个小的数值例子^ 

.... …： .. 

13.2 考虑 一 个只有七户家庭 的微型 城市,如表招 d 所描述， 
从这个表我们容易算出每户平均年收入 / i 为$ 2 9, 000. (符号$代 
表元，这里指美元> 

假定我们得不到表 13. 1，而决定取一个5户人家的 W 单賊 (ft 
样本以求出年收入。如果样本包含家庭1，2, 4, 6漸7,韓本平 
均戈是$ 2 2 ,仙0.在提出逾一数值时,我们应该认识到其他无值 

a 
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13 , 1 微型城申 


年收人(单位：一千美元) 


河的北边 

1 

2 

3 

河的南边 

4 

& 


也可能出现，并且从》怕会出现 i 的其他值来讲,我们会被导致去 
描述 i 单个值的不确定性 # … 

慎重考患什么，是“恐泊会”是统计思想中一个重要钸份。我们 
必须考虑从一给定总体的一个单一样本算出的一个统计量的意 
义*如果一切可能的样本都抽到，它们的统计量之值所构成的一 
个概念性总体_们要考愈的。对这一概念性总体,.存在一个概 
率分布称为抽样分布，这一分布今后会用来解释来自一个单一样 
本的一个统计量值的意义 • 

' ^ ' ■ ■ ■ 

_ 13, V 在表 13.1 的总体中，什么是简单随机样本可能产生的 

S 之值？对这样一,个小总体，我们可以具 体地对 出“切可能的样 
本，得到的 i 如表13_2. 

由表我们可以计算 i 的均数和方 差为 。-… 

- 51.05 

， 1 歲 W ，2 辑供,一个关于一切可能样本的基本思想方法，但为亇 
计算 i 构方差。却并不需要排出这张氣在抽样调査中、这一方整为 

*跡* 


3 S 

7* 

is 

IS 

12 

20 




m 13-2 3 单随机抽徉 


样本家庭 


Z 3 


2 Z 


Z Z 


S 


6 


2 3 5 $ 


2 


3 


5 ft 


5 6 


5 6 


2 3 


2 S 5 








5 7 


5 


5 


a a fi 


2 4 e 


3 


6 


a 3 ^ e 


3 5 6 


3 5 6 


3 5 6 


5 e 


5 6 


3 4 5 6 


2 _ 


N-n S 1 


- 

概率 

34+2 

1 

21 

34-0 

1 

21 

33.6 

l 

21 

21-0 

1 

£1 

1 

皆 -rT- 

21 

29-B 

30-6 

1 

- 21 

35-6 

1 

21 

35,2 

1 

21 

i 

22；6 

1 

21 

1 

31+2 

21 

32,2 

1 

35 + 0 

1 

21 

22 A 

上 

21 

31-0 

1 

21 

32 0 

1 

21 

■ 

1 

22-0 

21 

1 

30.6 

21 

31+$ 

1 

zi 

l 

18.0 

21 

190 

1 

zi ■ 

27-ft 

丄 

h 

21 


N 


a 
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其中 

N =总体的大 / J 、 
n = 样本的大小 

s 4 = 总体的总均方和 Sb -/OVW -1> 
由表 13.1 的数据得 

543,33 


因此 


N 


S £ 


N 


2_ 

7 Y 


31.05 


小结一下我们学到了的东西。如果取一 f 大小为 n 的简单随 
机样本并计算样本均数 L 我们可以怍如下陈述 t 

]. 所能得到的一切可能的 i 的平均是原始总体的均数6表 
为期望值，我们说 E (幻=心并称5为无傕的， 

2* 一切可能的 i 的方差，其公式为 

, N^n S s 

ai== ~NT" 7 


对相对于 N 为小的 n , S 的方差很接近地近似于 



13.4 方差公式涉及未知参数，因此必须估计。方差的无偏 
估计为 

无 N^n s 2 

^ N B 

其中 = S ) VU -1>* 样本的总均方和，为了说明情况， 

假定我们曾抽得样本{1，3, 4, 5， 6}. 于是 S £ =785.3,所以 




7 S 5 + 3 

— T ■ ■ ， 

5 


= 44.87 


如果我们不知道总体的收入均数，这时可以提出样本均数 



5 E - M * 6 作为估计和一个估计的爭 准差& = r 

■:: .y ■ j . ■- 1 K - - ■: I ■- - i ^ : 

U i 相当多的时候，鸪体是分_的 ( 或分 釋的] t , 分成两块蜱 
多块(层 >，.并从块内取一随机样本 • 对于我们的禪翠域市，偁 
定我们埤官兮为 m _ ( 层 k 河张边的家奉和河南边构家 iu 然质 
从河的北边取 两个^ 的一个矗机#本，从河的南边取三今家庭 
的个随机拜本 • ' ; . 

_ | _ ■ ■ ■ ■ a . •. ■ ■ a 

表 13.3 分层随扒抽蛘 

r 

家 瞌 .. : K \ 家 I 庭 '-.^^ . '" xut r 

~ r ； '2 ^ S : e 1 : - ^ 21.55 fr 

V t 、、 2, 咕 'U 」 5: 7 r r !: 执 07 v 

4 ■ .^ 3 . 5 4 ■« r 7 ■■； ! ; J 5 ; 味： ）2 Z . 眯：， ，：、 

H 2 ' ： ]92^ ' ; 5 # T ;v : 16. 时 ，： w 

1 3 54.0 4 S 6 13 . 衫 30*76 

,i ; z .-.. v Bina^t s ^ 7 ie^o ^ s$.t 

1 3 64 g 4 , « 7 l 5*/7 32.09 

， 

X 3 & 4*0 - 6 尜 ■ 7 16,40 —■ 21 , ， 

2 Z SG 5 4 S 6 13.ZZ 31.83 

■ • ■ ， * ■ 

2 3 56 + S 4 5 7 1C.00 r S3,36 

2 3 56.5 4 6 7 15 + 67 33,17 

■ n m 

2. 3 56,5 5 ft 7 15.00 Sg,79 

对河的两边作上一节中的计算,这给出 M 组样本平均 iN 和為，再 
把它们合起来算出 x st = <3 s N + 4 xs >/7. 这些计算列¥表 13. 3中， 
分层估计的一切可能值的平均象 S —样是 29. 00,所攻 S 4 也是^ 
的一个无偏估计*比较表 13.3 中的心之值和表 13*2 中 S 之值 ，珂 
以见到分层估计变异很小。心的方差是 21*66 而 S 的方差是 

3 M >5 正好证明了这一事实 * 、 :, 

■ ■ 

: h 

、， IM 在实际进行，个城市匍査时，我们必须想一些方法似 
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获取所霈要的信息。事实上，我扪也许没有1张全部家庭的清单 
而要想一些其他方法。如果采用逐户访问人员或许要利用该城市 
的地图。在这些情況中 ，我彳 rj 不得不对随 m 抽样作_些让承， s 为所 
有的居住单元并木显笨在地图上 ， 例如以随机地娃择街区;而 
在街区每三所住所内取第三所。如果进行2次电话调査，我们必 
须对琬有的电话弩码簿感到满意;并且承试某％人没有列乂其中。 
如果有一个合理的住户单子<比如电码号码簿)，可用一张邮寄调 
查表， — ’ 」 

不论用什么方法，总会遇到我们微型城市例子不会遇到的重 
大问题。有时不面答率将会很高。如果我们计划一个相当小的样 
本作为开始，不回答可能给我们如此 小的一 个样本使我们的工作 
提不出什么信息。假如我们的工具或调查表没有预先试猞过，使 
被调査的人事先对它都有所理解，渺么也可能会发生其他问题。 

I ■ 

1 S 7 我们已考虑当总体的大小 N 相对于样本的大小 n 来说 

表 13.4 来自一个无穹大总森的抽徉 


表 13 +S E 的抽样分布 





是大的话^会率;车什么 情况， 这厂 请洱的項累常&较简单的公琴;， 
因此我妁蚣来^ 。无 穷大” i 体鈇 随 k 抽样磁兴趣:考虑一个很!大 
的总体，其中三分之一为 1, 三分之 广为2 和三分之一为 3, 因此 
/* ==2和 a a =2/3. 考虑一个大小为 n ’= 2的样本并考虑 S 的抽样分 


年,表1 s ， 4 臶择 坤辉巧样本连同的蔼，由襄 i 3 . 4 很寄易 •得到 

s 的分布如所示。 


由这个衰,我们诃以计箅 i 的均数和方差并求搏 


oi 甲 + = £ tVh 


许多 有关抽普分* 的思早在 W 32 #<E nc fcer^D 就 
&发表; T , 许多结果给年代 < Airy[U):: 然而，皮条逊的 
论文[ 7 3常被认为近代抽样分布理论的开靖。1利&年发表了 Stu- 
denfb 奋文后这一课輕谭到 强太的 推勃岁 。费 希尔从 iftlS^ 的论 
文[: 5 ]开始，获得并发表许多统计置的抽样分布，这些统计*用于 
分祈数据。在费希尔的工作之后，无数科学研究工作者获得了几 

乎每一 个谭象到昀统 计韋钩 抽祥分布*、 

■ 

小结近年来美国人口调査烏广泛利用抽样以获取人口的信 
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息。在山一总体収 d - 淹单随机样本时，样本均教 i 可用来估计 
总体均数士如果取得一分层随机样本，则可用一个样本均数的加 
权组合为比较两个估计，要求考虑从一协对能样本所能获得 
的不同值，这就导致所谓抽样分布 6 

无和 L 的抽样分布都有与原来总体相同的均数，因此元和 
h 都是 ^ 的无侑估计，然而如果层选得好， S st 的方差较小于 s 的 
方差 

简单随机样本的样本均数的方差为 

.N-n 

= ~r — … 

N - 1 n 

如果总体 f 分大，为实际的目的可当作充穷 ' 大， 5 的方差为 o ： Vii_ 

■ - -■ . ■ , - 1 : ] : ■: 
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:习 题 

■i- 验垭來自表 2 的样本均数的为 M 值，证封岗样的速可由下式得 

N-n <T 2 


到 



i, 痕如在§13.2我们抽得样本{1，2,4,6,7}，_这 一样本估计 
^ 佔计你对 M 的估计的方差。 

3. 假如 我们釆用分®随机抽样，结果抽3>在河的北边和<4, 6* 
n 在河的南边，试估计平均年家庭收入。 

A . 在一小城市中举行一次分层随机抽祥以估计已婚夫妇平均每周的 
食物费用，夫妇分为四度 * (a) 年龄 20 至 40 、无子女的夫妇， （b) 年齡 40 或以 

C . 

上、无子女的夫妇， （c) 有一或两个子女的夫妇， （d) 多于两个子女的夫妇， 
房的小大，样本大4、，样本均数和样本方差如下 



试估计平均每食物费用，_ 

5. 考 虑〜个 很大的总体，总体的分布为 

x P(s) 


b. 

样分布 


计算均數#和方恙 <7 2 。 
对一个大小为2的样本，求 


S 2 ， 和 Xm aK = max(i t ，li) 的抽 


C , 对 b 中毎一分亦，求均数和方差6 
d t 验证 = h <ri ^ < x z /n ftl = o 1 

6, 一联号超级市场的老板正在考虑在一邻®城市逮立另一超级市场, 
并雇用一信息研究公司对顾客的态度进行一次词查，由 5000 户城市总体中 
选取一个 S 0 户的随机样本，许多问题中之一问到每月购货预算，样本报吿 
月®算总数为一万美元，而样本的 S 2 是二千<美元汽试估计 
a , 整个诚市的平均月购货预箅4 
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b . 样本均数的方差、 

c. 整个城市月购货璜算的总数 # 

d . c 中估计的方差。 

7 . 学生咨询指导员对学生为什么读完大学一年级后退学进行一次研 
%. 她从过去10年中退学的许多学生中随机地选取若干人并得到邡人诉说 
他们退学是由于分数不好的原因，这26个学生的平均积点 ® 乎均为2,1灯， 
S 2 为0.2638。对这类因分数不好而退学的学生，试估计他们的积点平均* 
什么是你对这一估计的方差的估计，如果读完大学的学生们的第一年积点 
平均是2.417,你 是否认 为数据支持那些退学者所提出的理由？ 

8. 由表 A .1 抽取大小为15的两位数码字的随机样本。然后计箅样本 
均值并怙计样本均值的标准差，你的结果与总体均数 49.5( 总体均数是从随 
机数表中模拟出来的 > 是否相一致7 

3. 在一总体中某些 I 为1而其余为0,如果 Np 个: t 为1而 N ( l - p ) 
= Nq 为。，试证明 

^ (ij -^> s = ^ Np( I - p) ^ Npq 、 

10. 举行一次调査以估计有百分之几的人赞成某一提案，设 = 1 代表 
她赞成这个提案 ， Z = 0代表她反对％然后址明样本百分 数赞成 提案的 f 等于 
元再估计$的方差是 

_ N _- n ^ pq 

IT^T m 


© 积 G(fadepoint*) 是计 苒学业 总平均的一神权数，比如成积分数分为优, : 
良 - 中、可 、 劣 K 等，可等为及格，一种常用的积点制是优为 4 ,良为3 •中力 2,可为 
1 _ 劣为 1 ~泽 者注， 
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中心极限定理 

14.1 在统计 中有一条被许多人认为是最重要的定理。它是 
关于随机变量之和（球 均数〉 的分布的4当随机变 量的个 数增加 
时，和 (或均数〉 的分布趋向于正态分布，并以正态分布为极限。称 
这一定理为极限定理看来是自然的。由于它在统计中的重要性或 
中心位 ■，用 Polya [3： l 在1920年给它取的名—— 中心极限定理 
看来也是自然的。 

14.2 如我们讨论正态分布时所指出 r 对分析正态分布的数 
据有众多的统汁方法。事实上，自然界中的许多观察集合都可很 
好地用正态分布来描述。此外，有很多被分析的数是其他观察之 
和（或 均数) 而这些观察可能并不遵循正态 分布， 让我们举两个例 
子。 

h 在教育研究中，基本数据常可从调査单上的回答得出，调 
査单上每一项目的倒答可能是五个可能回答之 一，-2，-1， 0, 
1, 2. 于是这一项目的回答都是高度离散的，而回答的分布是非 
正态的 a 然而我们感兴趣的可能是每一回答者的总分,并且总分 
是多达50个项目回答之和，对总分的分布，正态性是一个很可信 
的假设。 

2* 在电子器件的寿命试验中，记录下每一器件的失效財间 
(失效前的操作时间）。这种失效时同典型地服从非正态分布。然 
而，一个包含几个器件的样本的失效总(或平均)时间将服从一个 
十分接近于对称的分布，对中等大小的样本，对总数(或平均)作正 
态性的假设是合理的 # 



t 4.* 在德•莫哇佛 C 2] 之前，还没有正态分布，自然，也没有 
明确承认的近似正态性。德*奠哇佛所走的一步，既是走向提出正 
态分布的一步，也是走向提出中心极限定理的一步。德 | 莫哇佛所 
得到的就是我们用近代术语称之为二项分布的正态近似。 


14.4 我们釆用类似于德•莫哇佛的观点，对中心极限定理作 

经验的引入 # 考虑二项变量 X 的分布，让 it 增大而 p 保持为常数 # 

■ • 

由表 Ad ， 取 p = +的下列概率 〈见表 14*1), 为了见到 II 由1增 

到5的效果，考虑图 14. 1中的各张图，当!！由1增到5,我们见到 
正态分布的三个特征开始呈现出来。 

表 14.1 -^^4 (p = y ) 

~---- ■■ ■ ■ 

x n- 1 n = 2 n = 3 n= 4 n = 5 

0-1975 01317 

0.a9Sl 0.3392 

0 + 29 & 3 0^3292 

O.V9S& 0^1646 

0.4123 €.04]Z 

0.DQ41 

i * 撅率是分布在数轴的许多 点上。 

2* 概率分布越来越变为对称。 

3. 钟形特征在3时略见端说，而在 n = 4 和 n = 5 时就 
没有怀疑了。 

如本例所示，当 h 无限变大时，向正态性收敢得异常迅速，因 
此对于很小的 n ， 分布已开始接近正态。 


0 

0.G0I&7 

0.4144 

0 + £96£ 

1 

0 3333 

0,^44 

0.4444 

2 


0.1111 

4.2ZZ2 

3 



« . 0370 


4 
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为什么当 n 无眼变大时 X 的二项分布趋向于正态分布 


* 
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i (e) 6 

■ ■ . 

^ 1 卜 ■■ 

… B nr 二琐概率 ( 产 +) <b)ft=^r(c>ff=-3, Cd)fi=J| t (eK^S* 

呢 〆 为了能运用中心®限定理，我们需要认遍 n 次试验+成功私 
次数 X 是 n 个变羞之和实士 ，〈： … ' 


X - 第一次试验中成功的次软 
十箄二次试验中成功的次数 

■■ r 



+ 


* * i 



h 次试，驗申成功的次軚 
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«.6 为了理解中心极限定理 * 重要的是要懂得从一总体中 
抽样的 过程， 假定原始的总体是均勻分布的，如表所示。其 
次，考虑一个大小为 t 的随机样本中观察值:^和^的 联合分 
布。 X，和 X 2 的联合分布是 M 示在表 143 中，表屮稆弧内的数字 

表 14.2 垛始思体分布 

■_ ■耳 ■■■■ I 

„ _ L _ _ ■ -*■ - *■■ 

X PCx) 


t 



I 

it 14.3 " Xi ^ Xj 的 联 1 合分布 


P(xi) 



- - -■ - ^ ■ ■ I a i — 

是义+毛：^和。和 《 年何傳的概率于是可从七应对角线上渚概 
率加起来 而得。例如， + 这樂进行，就得到\ 


+仏的概率分布如表 ik 、 ’ 

下一步,考虑大小为、 3 「尚 1 M 机样本中 x t 和 x 3 的联合分 

布，如表 14.5 所示。表中括弧内数字足和 X t + X 2 + X s 之值，并 

且如前一样，和的任#值的械率甚把相应对 ft 线上诸槪率加起来 


* ^， 





而得，因此 


p ( WX 3 






2 12 
- 丄 

64 64* 

■ ■ ■ n-L 


这样.我们得到\ + Xi-f X ,的概率分市(见表 14.6) 




表 T 4 ,5 Xi ^ X 2 ^ X 3 的联合分布^ 



用安做的破 W 可以彳导到 X t +、 X 4 十 X * 的概 ♦: 分;布如表 


: U -7 和： Ud 所示。 


‘ 1胁‘ 



、表14 * 1 X 』 十 Xj — Xb 和 Xr 的展舍分布 


表 14.6 a 1 + X ) + X ^ 的 H 率分布 

I - M 

Xl +Xj + Xi P < X 1 +Xj 十 Xj > 
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14*8 Xi + X» + Xj + X4 的柄率分布 

Xi+Xj+Xj + X^ POcj +Xj+Xi + X4> 
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样本总数的几个概率分布的图形画在图 14*2 中。如同二项分 
布那样,惊奇的是，对非常小的样本开始出稞钟形的现象 # 对来自 
这个原始的均勻分布的大样本，为了实用的目的,和是可 识看作 正 
态分布的 # 


H*7 我们用了两个简单的例子说明了中心_限定理的基本 
思想。实际上，中心极限定理有许多种不同的理解： AdamsU] 总 

结了几神重要的理解并给出这个定理发展的一个很吸引人的序 

述* 


小鎔统计理论和方法有很大一部分是预先假定一个 JE 琅分 
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布,显然,原始数据常索不能很好地用芷态分布来描述，但分析座 
对观察值的和或平均进行的，这些和与平均是趋向宁正态分布 
的，一条著名的极限定理说明情形确是如此 * 由于这一定理在统计 
中的重要性，所以称它为中心极限 定理。 

把增大 u 值的二项分布或把增大 X 值的普哇松分布绘成® 


Pi ^) 



p(i?l + II) 





(b) n = Z 


P ( + 



+ + + ®il <c) n-3 


£5/256 




A 


_ 


1 Z ^ 4 5 G 7 8 9]Om213U]5lt 

(d) n-4 


4 + rj + x% 


# 2X a C*>ii = I, (b)n~a* (c>m= 3, 4 
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线，便能见到板限正态现象 • 

诸随机变量的和不但趋向正态分布，而且其收敏还是相当快 
的，当颯察值是取自一个离散、非索不正态的分布时，求辟\ + 
x” X 1 + X , + X 3 , X ^ + XdXa + X ,， 等等的分布就能看出这二 

点，很快这些分布就开始呈现对称的钟形。 
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习题 

^ I 

■ 

1- 扩展图14,1，画出 p = +, nm 9,10 的二 项恿率图线* 

! 6 . E-. 

2, 己知下列概率分布 

■ - ■ 

X P<3C> ' 


试求出 Xi 和叉 2 的联合分布并从它求出 + 的概本分布 ff 其次;求1 + 
X. + Xi ^Xi.+ X 3 + X, + Xi 的 分布— 画出这些分布 w 图线，它们向正态性 

的收敏看来是 bt . H 4 * 6 中抚用的均匀总体来得快一些还是馒一些？为什么迭 
是合理的？ 

S . 从表.沖所飨出的总体分布开始，求出大小为5的餚机样本之 
和的槪 率分布 • ^ ' .- 

4. 在一次考试中一学生被要求 讨论中 心极限定理， 他写逋 41 当样本的 

*妫3. 


fs^l 10 




数目增大时，^变成越来越近似正态这一答案错在哪里7 

5. 由一大的总体取一大小为10的样本， c^ = aVii。 若0 = 8, <7 4 * 
40,标准化样本均数5 =JL2 只要从中减去 P 再以5的标准差_之。如果总 
体近似正态，用此标准化值和表 A. 3求 2<12 的概率 a 

6+如果从具有 A = 1£和〆= 25的近似正态的总体屮 JS —个大小为16 

的样本，求下列诸概率。 
a+ P<x>14> t 

b. P(13 <k^16), 
c* P(x<14 t 5) 0 

7 . —交叉要道被观察了一个长时期，并发现在-次红灯时到达的车 
辆数是参数2 = 12的普哇松变量，我们感兴趣的是36次红灯 36) 平均 
车辆到达数 L 用中心极限定理和表 A 求元超过6 + 5的概率。 

8. 对一张调查表采用五点制打分如果响应(分数）-2，-1，0,1, 
和 2 是等可能的，求响应(分数 〗 总体的平均响应和方差对一张有50 
个问题的调査表，什么是平均响应5的均数和方差，求^>1的槪率， 

9. 如果不用习迥8中五点制而用1，2, 3， L 5 的五点制，若全体分 
数是等可能的，什么是均数和方差？在一张有50个问题的调查表上，什么 
是平均响应 5E 的均数和方差 f 求 ii>3 的概率。 

10* 当 it 变得较大，二项概单可较接近地被正态分布概率近似。对 n = 

I 

100和 p= 求 X = 50的概率，如果用分组 -0.6 〜 0.5, 0,5〜1,5,…的 

直方图，这一概率给出为单位宽组标在50上直条形的面积，用 /* = 50( 即 flp> 
和方差 25( 即 npq) 正态曲线下由 4 9.5到 50*5 的面积来近似这个二项概 
率* 

11. 对大的 n , 二项分布很好地被普哇松分布和正态所近似，因此具 
有大; I 的普哇松分布应很好地被正态分布所近似 • 设 A =10，20,…，印， 
画出普哇松分布曲线 o 

12■用组标在1，2, 3,…上的直方图来表示 A =20的普哇松分布 f 用 
U^A^ZO^ 和/ = >1= 20的正态曲线下由 19.sm 20.5 的面积来近似组标 
在20上直条形的面积。 

13+由表 A.1 抽 15 认个随机样本，每个样本包含 S 个“位数字的数 # 
对每一样本计箅 L 构造频率分布并对你的祥本构造一直方困，注寒元的 
分布比个别的 x 的分布更加接近 IE 态， 
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—教育科研实验用了一台仪器，它包含对100个项目的二元响® 
(即是或否，正确或错误，等 等）， 一个响应记为0而另一为 U 在一个包含 
等可能的0和1的大总体中，扦包是它的均致和方差？如果每一项目的响 

I 

应是等可能的》什么是100个项目的平均响应的均数和方差？应用中心极限 
定理，什么是 £>0.75 的輯申奸 > . 十一 

15. —统计系的毕业委员^声称它的新学生确实比平均 的好。 按**毕业 
辟绩考垆分析记分法*昀耸国乎草 I 和标崔差分刿知道是 sas ^117,譽取珲 
个系的 ^ 20个新学生有一_均分&分数624, 如巢这 ZQ 个学生 : 是总在的一 

L ■ 

个随机样本，什‘是平均分数 f 大于 e 24 的概幸 t 1 

ie * 某二域市经过 A 年干单之后,人们在 m 滅气象模式有一六改劣过 
去 so 年 i 的年碎南 k 有二琦值 42. 36 时， 相二 个标准 MfliU 时,; Jii 去&年的 
平均降 雨瀣是 吋，应用來 g 均值为 42.36] 时和标 准差为 35.72 吋的 
总体的一个大小为5的样本，要得到这么小的一个样本均值，它的煨串是 
多少1 * 否这一概率对气象大改变发生姨问？. 

| I * 
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: 资讲 15 ， 

“Student”^t … 

■ ■- ■, r 
， - ■ ■ - L ： 以 

1(1 ;859年在 t^blin 城 ▲近 古老的 St, James 门的一块 
土地上 ： Arthur 6uin aess 创库了一个啤酒酿造业[幻，这一事 
业很兴旺，1于 > 886 年扩展成为责任有银公3。 Gj^imess 变成十 
分富有并是一个伟大的公共事业兹善寒。在十九世纪末, Gain- 
ness 公司象今天的许多工厂一样，开始雇用一些受过大学教育的 
科学家 # 一 : ； ' : 

W.S.Gosset 于1町 6 年生于古老的大教堂城市 Caiitfe 浼 urn 
在他读完 Winchester 和牛津大学 New 学院的教育以后，于1899 
年参加了 Dublin 的 Arthur Guinness Son 有限公司作为-个 
酿酒师。在被雇用后不久，他就开始运用他的创造性才眢于数据 
的解释和大麦实验的安排。在 Dublin 工作了几年后，他被送往伦 
敦大学作一年的专业学习。自19⑽到1907年他在伦敦大学学脘随 


^ Karl 皮尔逊一起研究统计 


IS, 2 在1907年, Gosset 用笔名或 假名* Student” 发表了第 

—篇论文。在以前关于普哇松分布的一讲中 我们己 提到过这篇文 
章。 190 S 年的 Biomeirika 上出现了 Gosset 的第二篇论文，题目是 
“The Probable Error of a Mean' 它含有好几个重要结果，包 

括一个统计置的分布，这个统计量后来成为熟知的统 

计量 * 

Cosset 总是用笔名 “Student” 发表了一系列重要的统计论 
文。初开始只有很少几个人知道他的真实姓名，他早期论文的大多 
数读者只能猜测他足谁 <E、S+ 皮尔逊 [4：|(Karl 皮尔逊之子)注意到 
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在 1907 年的沦文之后许多年存在着一种浪漫的气氛与 
这 卜名 宇联在一起。奈曼 ( Neyman ) [5] 指出许多统计学家正是 
在1 年 Go $ set 死后还不知道他就是 “Studep t ”。 


IS . 3 Go^et 的贡献是什么呢？在试行回笞这一问题时，童 

■ ■ • 

要的 S 回忆一下在那个时挺某些熟知的结果。已经知遺从均奧为 
^ 方差为的正态总体沾取样本的抽祥分布是均数为#方華 
为 < t 7 ii 的正态分布。还知道是上个标? t 正态娈 
M ， 因此标准正态分布表对评估样本平均 f 的意义臬很有用的。例 
如，假定在一地区通常种的一种大麦其产量的标淮差是6 (单位是 
蒲式儿/英亩>。一神新种大麦将种在10块试验田里，我们需要评 
估结果的某神方法使帮助我们决定新品种是否不同 > 在那个时候， 
—种有诏的方法是确定一个区间使—个变量蒋在其中的概率为 


2 


. 由表 A . 3 , 我们现在可以见到 


P<— 0,6745^2^0*6745) =0*5 


因此 


P^™0.6745 


X — P 

< — 7 ^-^ < 0,6745 1 = 0,5 


n 


由于 CJ =6 和 n = 10, 我们有 


P 卜0+ 6745< g ^=<0, 6745 

对不等式的每一项乘以 6 八我们得 

P(- 1.28<x-/*^l,28) =0-5 


)= 0*5 


换句话说，样本均数与总体均数相差大于或等于 1.23 的概率是 
0*5. 如果实验产生一个样本均值每％宙30蒲式尔，我们会觉得 
所给出的区间30土 1.28 包含或不包含"的机会是均等的。 


15.4 Gosset 处理了小样本的情况，通常在这种情况中，偎 
定 a 为已知是不合理的，他箱要考虑 
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Z = (x ~ M )/ S # 

的分布，其中 t 1 

S ^ = i ： ( Xi -x)Vn ' 

卜 i 

并且总体是均 _ 为氏方差为 V 的疋 态分布（注意璋里的 z 夺是标 
准年态变量)。 k 然他没有完成数学证明，他碕实正确地推得珐 
— 个常数乘上一个卡方变最（这里卡是希腊字母；< 的读音，长方就 
是;^ -— 译注>并且 S 和 sw 是独立的。从这些结果他得到正确 
的结论， Z 的 h 样分布为 

I 

I 

£<Z>=cU+ZV^ 

其中 c 是一个正的常数。他抽了许多样本并对每一样本算出 Z, 从 
而验证 了:理 论曲线和抽样数据符合得很好。用今天的术语，我们 
会说 G osse t 用模拟法验证了抽样分布的形式 

• ■ 

15*5 EisenhartCl] 回顾亍 Z — 步变到 t 的过程，其中 
t =〆 Tu — ")/S ， S a ; S(X 3 一 S) V ( n ， 1) ， 

i- 1 

其中总体是均数为 " 方差为/的正态分布。这吋 t 的抽样分布为 

a 

h 

/UJ 


抹准 iT 态 
t ， ft 由度为5 
U 自由度为 S 





因此 t 的分布依赖于 n , 而 v / n (5 E - M )/ a 则否。现在已成为习惯 
把这种依赖用 II - 1( 称为自 由度) 来描述而不用0。图 15* 1显示奸 
几个 it - 1之值的 t 曲线和一条标准正态曲线。由这几.条曲线我 
们可以见到曲线是对称的钟形曲线， （2) t 曲线比标准正态曲 
线有较大的变异， (3) t 曲线当 II -1( 同样当 n > 趋向于无穷时看来 
趋近于标准正态曲线。这—极限性质可以数学证明。 t 分布表列出 
于表作为表的一个例子，当自由度为10, 

PCt<2*22S) ^0,975* 


15.6 为了理的 t 分布对小样本统计的冲击， 

考虑早先提过的那个大麦产置实验并假定我们一些也不知道什么 

是£7的一个合理值。对一个大小为10< 自由度 9) 的样本,我们知道 

P(-0.703^t<0*703) ^0*5 


9S 


P ( - 0.703< g ^=-<0,70 sJ 


^ P (-0.703 S / v /' n < S -^0*703 S / x /^ n ) : 

= P(|x-/i|<0 ； , 703S/x/*n) f 

于是我们觉得 S 与"相差不小于 < K 703 S / v / iT 的机舍是1对1, 
如果我们 M 察到 35, 11=10, SL 10,因此 

H 

0.703S/N/"n =0*703, 


我们会对，比如说，# = 30发生怀疑* 


15.7 过高地估计 Gosset 1908 年那篇论文的重要性可能是 

困难的。不但 t 分布从它本身来埃是萆舉的，它还引入了小样本 
统计的一整个新时代。 


小结 Gosset 于 189 9 年被 Guitfuess 啤酒酿造厂雇用*由于 
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工作的需要，他被引入他的统 M ■工作。他弔假名 “ Student ” 发表于 
1908年的 论文， 对科学有?基本的重要性，并 S 深远地影响着统计 
的发展。 . 

如果 P 和 <7是知道的话，关于正态观察值的样本均数的概率 
陈述早已是可能的了。一旦观察了 *，这就允许对 P 作出可信的 
估计值。如果祥本是大的话，样本方差可以用来代替 V ，但没有 
人敢对小样本这样做。 

G 6 矸 et 以 S 衫= 2 (x - 5 ) Vii 代^而去寻找 Z = U - /O / S * 
的分布，他推想出 JE 确的分布 ，几 乎完成他的数学推导，并 用槙拟 
作了验证。 

由于与费希尔通信的结果， Gosset 的结果逐渐犮展到它观在 
的形式,用 S * 幻 V(n - U 而木用 S * a ,」 并且 

/S, 

■■ 

• ■ • • . 
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f, P(lt|>2*179), 自由度为 12f。 

2. 应用表 A ,5 和 t 分布关于零对称 S — 事实，绘出累积 t 分布曲线， 
自由度为5, 10，巧，20，30和120。在同一张®上，画出累积样准正态分 
布曲线，注意当自由度变大时， t 曲线趋近于标准正态曲线： 

5. 已知数据集8，10，12，10，8，9，8, 12，13, 12* 

a + 计算桉下列次序 进行： （1 H 十算 X，（2) 从每一个X减 
去 S 以得到 X-S* (3) 平方每一 a：-L (4) 加起来。 

k 计痒按下列次序进行， （1) 平方每一 x 然后加起来以获 
得<2>再威去 （2 je ) Vii 

c , 计算5和 S 2 

d , 应用 “Student" 的 t 以计算 P( 6 

4* 已知来自一正态总体的隨机样本 22.3, 17*1，18, 5 S 19.6,22-5, 
21.0, 20.9 t 

a , 计算 i 和 S 2 

b. 应用 "StudeW 的 t 以计算 P( )5 -只 t >2 S ^)。 

S. 由于记法上的关系， t 表的应用有时是麻烦的，常以匕表示一个 
t 值，使 P<[tl>t*> = «。 因此，如果自由度是10,由表 A +5我们有 P<|t| 
>2.228) = 0.05,所以05=1223，自由度为 10* 对于下面，什么是 t 的 
下标呢？ 


a* 0,691，自由度 15， 
b. 2*624, 自由度 14* 

C. 4.144, 自由度 10. 
d. 2.571, 自由度5。 

6. 从大学生中随机选取12人*他们的体重（单位，磅)是 14], m t 
167，174 ,172, 159, 148, 157 , I 61 f 178, 164，和 J55 e 假定总体均数 

是165,计箅这一样本的 t 值，变换重量为公斤，并且重新计箅 t 值*它应 
该不变。 

7. 用代数证明如果每一观察 x 検成 y = a;c + b 且換成 a/< + b，t 值 
保持不变。 

I 一个养马俱乐部的会员们使用各神医药的和修饰的方法来准备他 
们的马参加一次展 览比赛 。 各种产品都 可商 来促使马蹄的增长；俱乐部决 
定研宄一种特殊产品对马蹄增长的效应，俱乐部的每一会员将这种产品用 
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在 他的马 的两个蹄上， 每 周度貴 一次它 们的增 按， 并在试验期末，对每匹 
马记录下比没有处理过的马蹄增长多少。十四匹马的增长（单位 I 英寸>如 
下 （ 1,1, -1*0， 2*2, 1.4, 0.6, 0.1* 0.% 0.4, 1.0， 0. T ， -0.6, 

-0-2, 0.4 和 0.5 。 当 /< = (>， 计箅 ^ 之值 * 求 t 的绝对 值这末大的概 
率，你是否觉得数据会支持这种产品刺激增长1 
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意见、结论和决策 


% 




演讲 16 

■ 

演绎和推断 

te.f 根据华生 （WaUoiO 的描述，在一个接一个的案子中 • 
传奇性的歌洛克*福尔摩斯 〈Sherlock Holmes》 运用 j* 嫌原理，总 
是得到正确的结论。不运气的华生 〈和读 苕）却很少成功。福尔摩 
斯踞于崇髙地位成为逻辑人的化身。现实中，真正人类的逻辑功 
绩更富有戏剧性，无数男的和女的科学家们的经历比搞尔摩斯和 
华生的故事更加难以置信并且更浪漫化。 

在採索知识中，科学工作者们运用逻辑法则坚持不懈地从他 
们所能获得的数据中试图得出结论,那么什么是逻辑法则呢？ 

16.2 逻辑是一门科学，它试图把一个判断的过程系统化，这 
过程是：在已知某些陈述为真时， 一 个结论可以认为是合法的。 
大多数我们认为真的或可能真的命翅是不能在直接感官认识的基 
础上作出如此判断的。例如 t 我们接受光速、竒速、到月球旳距 
离等一类数宇，对我们大多数人来说，都不是建立在直接观察的基 
础上。相反，我们接受这些数字是依赖于我们接受一群其他的命 
题，而这些命題有许多没有明显叙述或理解。事实上，大多数命题 
是通过论证而认为合法的，这种论证是从一个称为前提的已知陈 
述集合到一个称为结论的陈述来进行的。 

r 

ie.3 由一些陈述的前提到达一个结论的过程通常称为雄 
断，为了简单起见，推断的学习常常指两种类型 （ 瀘 绎推断（演绎) 
和归纳推断（归纳 h 推断这个词也常)! :来只 指归纳推断。按照 
SkyrmsCH, 我们说一个陈述是一种事实的断定，一个论证是一系 
列的陈述,从前提开始到结论终止，逻辑是研究前提和结论之间的 
证据环节的 a 
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为了说明一个演绎论证的思想,考虑下列例子 《 

Ml : 演绎论证 

前提：约翰的生日是在九月。 

约翰的上一个生曰下雨 4 
结论：九月下雨。 

如果我们接受例1中的前提为真，我们必须承认结论为真。这是 
不能躲避的。前提产生结论是确定的。这一论证说明了一个演绎 
上正 确论证的思想 — 般说来 ，一 个论证称为是正确的，如果前提 
是真的，结论必然为真。必须注意，正确性并不是前提产生结论这 
个确定性的一种 度量。 

例 2:演绎论证。 

前提 * 约翰的生日是在 Oct aroo ii < 混血儿>的月内。 

约翰的上一个生日下雨。 

结论： Octaroon (混 血儿） 下雨 

例2的论证演绎上是正确的。是否真实呢？天知道。怛是，已知前 
提为真，将以绝对确定性推出 结论。 现在让我们考虑一个不是演 
绎正确的论证。 

归纳论证。 

前提 * 上一个九月在记录上是下雨最多的。 

约翰的生日是在九月。 

结论：约翰的上一个生日下雨。 

例3的结论并不能在已知前提为真的条件下确定性地推出，因此 
不是演绎正确。然而它是相当可 信的， 因为在这个国家的某些地 
区是相当可能的。在任何降雨量很低的地区就相当不可能了 6 这 
个例子确实是归纳论证的一个例证。归纳推断中一个基本问题是 
想法去度量一个归纳论证的强度 

庹量一个归纳论证强度的大多数方法都要以某种方式来使用 
概率 & 对这类方法感兴趣的读昔在这一点上应注意概率的两种不 
同的解释*概率作为一 种相傕程度的度蠢和 概率作为某种系统中 
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的一个物理常数。对采用第一种解释的人，看来很自然地去定义 
一个归纳论证强度为 

P (结论 为真 I 前提为真)。 

对采用概率的第二个解释的人,看来也很自然地去拒绝这一定义， 
丽想另外涉及概率的度量。在统计中，这两神方法分别导致 》叶 。 

斯统计 和非贝 叶斯统 计* 

十分清楚统计的一大部份是涉及统 计推断 的过程，这 
过程就是依据从总体的一个样本所取得的信息来对这总体作出一 
些结论在这一点上，还应了解这样一个过程是归纳推断中的一 
个过程。由这一观点，统计推断是处于一切实验科学的中心。为 
了预知以后各讲中的内容，我们现在要给统计推断中某些主驀课 
题作一楢观。 

16.5 统计推断中许多问暖是由科学中的一些现实问 題所引 
起的 & 所用的 统计方 法以科学研究为依据，在这种科学研究中 ，假 
定了样本来自用某一特殊模型来明确描述的一个 总体。 例如 ，假 
设我们对两种减轻体重的特殊食品的相对效杲感兴趣，并设我们 
有对一个样本的人用每一种特殊食品后体 重减轻 的数据 a 我们芎 
以 假定，体重减轻的样本是从两个关于人体减重总 体中取 得的随 
机样本，这两个总体分别是具有均数叫和叫的两个正态总体。 
于是我们的方法的依据将是来自两个正态总体中每一个的一个随 
机样本的数学 供型， 十分明显模型的选择是十分重要的一步 。什 
么是选择模型的过程，或者怎样能断言一个模型是可信的？ 

棋型选择 本身就是归纳推断中的一个课魍，如果选择依据是 
数据，那它就是统计推断中的一个课通。已想出一系列统计方法 
来帮助选择模型，包括从简单图线的方法到所谓拟 含优度 检轚的 
严谨的方法 * 拟合优度检验之所以如此命名，是因为它帮助使用 
者来判断总体被一个 给定镌 犁描述（或象试穿一身衣脹那样的拟 
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合)得有多好。 

16.6 —旦模型被认为合理而 K 受以后，很自然地要集中注 

意于模型中出现的一些未知常数，称它们为参数*对正态分布，我 
们关心 的是# 和 〆 ，对普哇松分布，是 X ,等等。已经有了一些 
严遒的方法(称为检验用来判断参数的假设值在多大程度上被 
样本数据所支持。这些检验常被称为显著性检轚和(或 > 假设检驗。 

1«：7常常，特别当数学模型中的一些参数有一个物理解择 
时，有必要在样本数据的基础上对一个参数指定或猜想一个值。 
例如，如果一个正态中的 / i 代表一个集体的平均家庭收入，可能有 
必要依据家庭收入的一个随机样本对^的值作一个猜想。依据样 
本数据对参数值的猜想称为估计。用以得到估计的方法须有已知 
的特性并在应用中经过试用和验证。 

显然，一个参数的任何估计（或猜想)值总带有不确定性，而插 
述这种不确定性的一种方法是给出一个参数的值所处的区间 4 各 
种求区间的方法巳被研究过 * 最著名的区间是置侑 区阉和 贝叶斯 

6闻《 

我们在此已给出统计推断中某些主要分支的一个概 
观。我们曾指出统计推断位于实验科学的中心，值得指出，统计推 
断是建立在一个数学模型的假定上。没有这些模型的知识，统计 
推断只是一个相当狭溢的课題， 

小结 S 辑研究陈述之间的联系使当某些陈述为真时其他一 
些陈述的合法性得到加强.从前提陈述的给定集合到结论的过程 
称为推断*推断分为两 大类： 演绎推断和归纳推断 f 演绎推断有 
时波描述为由一般到特殊的推理，而归纳推断是由特殊到一煅的 
推理。对演绎推断，关心的是论证的 正碥性 。对归纳推断 t 关心的是 
在给定前提为真的条件下结论的可倌性》 

. 1«， 
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统讨推商是在一个样本的基础上対总体作出结论 & 首先一个 
问题 足对随机样本选择一个数学模型。第二个问題常常是对所选 
择的摸型中参敛值的选择。贝叶斯统计方法是直接找出有关参数 
的概率陈述，非扒叶斯方法，应 m 概率的一种不同的解释，涉及参 

数的估计，假设参数值的检验和合理的参数值的 ESU 

■ 

参考文献 

1- Siiftta^ Brian ^ (iBS^)Chotce and Chance^ CaHf ； Dick«tiM>o« 

习 题 

1. 在你的日报上指出一些演绎正确的论证例子和归纳冇力论证例子 u 

2. 在你主修的领域內指出-些不是演绎正确而是妇纳有力的 宜斐论 

证， 

心在给定 3 S = 1S ， 和 a = 36的前提下结论#+10这个论1正，你 
将如何分类？ 

4, 你将如何分类如下论证。在给定 S = 27,5， or=4， 和 n = 20，# IL 
样本是来自正态分布的前提 下,# 位于25和30之间？你将如何度置这一论 
证的强度> 

5. —家公司在雇用和提升雇员上有歧视妇女集体的习惯。西奥是过去 
曾为这家公司工作过的一个妇女。公司歧视了西奥。这一论征是一个演绎 
正确 的沿切 还壳_ -个 归纳可能的论证？ 

6 . —架太空飞行器计划回到地球完整无损。它碰撞着一个人的机会算 
出少于一百万'分 之一， 因此它降落在任何大都会地区内是相当不可能的 

是一个演绎正确论证还是_个归纳论证？ 

7, 在六月里在未宣 *( 正式)候选人之 - -个特殊咦选人受到民意珂 
査中10%的人的欢迎 a 在十一月它市了以后，民 意凋 査屮的人欢迎此候 
选人，它声称已得到支持。这一声称是否苻侬据？你将怎样度量这一声称的 
强度？ 

S . … ■咖啡制造商声称他的 咖啡一 磅比另 1 竞争牌号可冲更多的杯数* 
这一竞争牌号登广告说一磅可冲250杯 & 一个部门的咖啡俱乐部买了 10磅 I 
細第- - 磅以确定合适口昧所志数贯之后，对其余9磅记录下每磅冲的杯数 

. 149 * 




如下 I 以8,254,256,253,24,250_扣2,246和2%。用一个 P 的值 2 E 0, 计算 

t , 什么是 t 这么大或更大一些的柢率？数据是否支持新牌号给出一磅多于 
250杯的说法？ 
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演讲 17 

统计检验 

17,1 新事物， 有两忤； 

我称之， 事件一， 事忤二。 

Seuss 博土“乃泌 Cct ir* ihe 

什么时候第一次出现统 计检® 已无从确定，但 Arbuthiiotlll] 
给出一个早期的例子他考虑了82年这个时期中他所能获得的出 
生在伦敦的男的和女的人数的记录，并注意到每年总是男的多于 
女的。他指出在“机会”的偎设 T , 这样一个结果的概率将是 



Sti £ le r [5] 给出了统计检验的第二个例子,他叙述了袭币样品 
箱的检査，这是伦敦皇家造币厂采用了约800年的一种检藿*在这 
些年中铸造出来的硬币留出一些放在这个称为硬币样品箱内，在 
指定的时期把箱子打开，数一下有多少，称一称重量，鉴定一下成 
色，以正式确定皇家造币厂所发行的硬币是符合规定的。硬币祥 
品箱检査历史被很好地记录下来 } 而 Stigier 提供很好的一张: 

目录 & 在二十世纪以前，某些统计检验已经知道并使用 〈比 如皮尔 
逊的卡方检验[4]>,但只有在本世纪,统计检验才有全面的发展。 
ft Student w 早年的文章对检验理论的发展起了推动作用， 而费希, 
尔自1^5年起的一系列文章，将统计检验大大地推向前 进。下一 
个主要冲刺是1933年奈曼和皮尔逊 [3] 发表的那篇重要文章开 
始的。 

H .2 如费希尔 [2, 页 13] 所想象的， 一 个显著性徐轚包含下 
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列内容 

1,—个假定的概率分布中一个参数的假设值 * 

2* 当假设值是真的参数值时>一个分茚完全知道 的检® 统计 

置。 

8* 来自总体的一 个随机 样本。 

4-统计量的|计算 # 

5 * 当假设为真时 t 计算检验统 i 十貴取象实际观察到的那样大 
(小） 的极端值的概率。 

第五项中所箅出的概率称为显瞢水平或观察 a 著水平 1 如果 
它小,我们可作逻辑上的选言判断,或者假设不真，或者假设为真 
而一件小概率事件却发生了 • 

例1 一种无需医生处方治咳嗽和兑塞的药在它的标记纸上 
写明含有酒精—个消费者认为湳精含董每瓶不同，但所有 
生产出来各瓶平均含量可能是在 5 %的邻近。他买了 10瓶并对 
每瓶做了实验室分析以得出酒精含量，结果按百分数是5 + 01， 
4.87, 5.11，5*21，5,03, 4*96, 4*78, 4.98, 4,肋和5,06， 

如果酒精含量是认为遵循正态分布，数据是否支持假设均值5% 
呢7 


1 * 极设 fi = 5 
2 . 检验统计 f • 


S - 5 , 

t=f "VvTfo" 

注意如果这一检验统计量的分布是完全知道的并旦列成 
表 OStudentn G 由度 9). 

L 随机样本。实验室分析所给出的十个数宇9 
4 _ 捡验统计量的计 # 算 1 

x = 4*939 
= 249. 0425 
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- x) a - 0-14129 

s 2 = 0*0156939 

= 0*00156989 

Sj = 0*0396 

^ 4,989-5 
0.0S96 

s -0,2778 

5. 现察显著水平的计算。 由表 A , 5 我们见到 t 取这样一个 

_p ■- 

极端值（象 +0,277 S 那样大或象 -0*2778 那样小）的概率大约 
0*80, 这一概率很大从而建议5%的均数是与数据相一致的。如 
果在另外一面，我们得到了一个很小概率，我们将被迫决定不是 
5%的均数不真就是一件小概率事件发生了。 

注意观察显著水平并设 有给出 原假设为真的概率。它不是对 
一个参数 （或 几个 参数〉 的任何形式的概率陈述。考虑下列的比 
喻, 在审判时，一个祓吿人申说“有罪”，而经验指出只有10%的无 
罪监犯申说有罪。于是，已知有罪的申说情况下，我们感觉犯人是 

有罪，或者是清白而一件概率为&的事件发生了。然而，这与清白 

的概率为&的说法是不同的。表为符号 

P ( # 无罪，的申说 I 淸白 ） =« . 90 手 P < 清白〉 

观察显著水平在许多科研的杂志里遇见过井且 常常简 单地标 
为 P 值。 此外,许多统计程序计算包把观察显著水平作为一种常 
规计算 • 


17.3 1933年奈曼和皮尔逊发表了一篇关于假设检检的论 
文[3]。在以后的年月里他们和他们的追随者发展了检验理论，类 
似于费希尔那样但比费希尔更严谨。如奈曼和皮尔逊所发展，统 
计检验是一个决策过程，它要对关于一个参数的两个可能假设作 
出接受一个的决策 * —个假设称为 簞儀设，另一个为备择值设 





如果原假设不真时我们拒绝它，或者它为真时我们接受它，那 
么在判断上就没有错误；否则，我们犯两种可能错误争的一种。它 
们称为一型 错误和二里错 当原假设为真时拒绝它，就犯一型 
错误 * 当原娱设不真时接受它，犯的是二型错误。 

很自然我们想要消除两种错误，但这是不可能的相反，我们 
被迫要去满足于控制这两类错误的概率。我们引入奈曼-皮尔逊 
假设检验的少数几个术语。 

a =—型错误概率 
=显著水平 
二型错误概率 
1-沒=检验的功效 

我们想要 a 和0都很小，但是看来它们有各自的意向 。使 a 
小，彡就趋向于变大 * 使夕小, CZ 就趋向于变大 P 常用的简单办法 
是任意地固定％再增加样本的大小使於成为可接受地小6 

用陪审团审案子的比喻，我们可取“无罪”为原假设。按照盎 
格鲁撤克逊法律和习愦，一型错误的概率要保持很小，结果有时会 
使二型错误概率比想象的来得大 • 

按照奈曼-皮尔逊程序的一个检验的组成部分如 
1* 关于一个假定分布中一个参数的原假设和备择膜 设* 

2. a 和芦或 a 和 a ， 

»• -个检铨统计 ：!：• 


_ 







4* —个决策法对 》 

5* 总体的 一个随机样本 * 

«• 检验统计量的计笄。 

7. 从检验统计量的计箅值和决策法则所得出的一个决策 
一种饼干的生产者在每一盒上指出盒内含量是269克 & 
他热切希望不把轻于这个重量的盒子输送出去，质量管理科嵌定 
重量是一个正态 变詈， 设计一个检验程序包括 T 列组成部分, 

1. 琢叙设、 #i = 269 d 
备择假设、 ft <269 0 
2 ， a = 0*05 ! 

3_ 检硷姥计量 

A S -269 

4, 决策法則、如果 t <-1.699 的话，拒绝原假设 # . 

5, 随机样本、 由生产线上随机地选取30盒，结果得一个均 
数268和 s = l ，8 

6, 捡硷统计量的计算 



— 0 * 32^6 


5^269 


-I 


0.3268 


-3*06 


7* 因计算的 t 是小于 - I * 6 ", 我们拒绝原假设并总结说生 
产线没有满足广吿上声称的平均毎盒269克， 


UM 在许多情况中一个统计检验或多或少地用来评估数据 
而不是要达到一个确定的决 策1 这看来是费希尔的态度，因为他 
总是想着科研的情况。在其他情况中，问题的背景要求一个明确 
的决策。这神情况看来用某神决策法则如奈曼-皮尔逊法来处埋 
较妥 t 我们将在33讲中作进一步的讨论 
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小给，嫌计检 轚已有 很古老的痕迹 了6 最皁期之一是伦教硬币 
样品箱的检査，这是对皇家造币厂涛造出来的硬币所施行的一种 
超过800年的检验。然而在二十世纪我们研究、改进和广泛使用统 
计检验。理论开发始于1900年皮尔》的工作和1908 Sltudedt ” 
非常重要的工作。从 W 15 年起费希尔对检验的开发作了重大的 
贡献。 

给定了一个参教的假设值，从随机观察样本箅出一个》 轚统 
计*。观察显*水平是当假设为真时，一个统计童取极端值的概 
率。这个值是假设值可信性的一个度量。 

奈曼和皮尔逊提出一种检验，作为较严谨的接受或拒绝的法 
则这一理论要求指明二个假设，一个原假设和一个 备梅假 设。原假 
设为真时拒绝它，备择假设不真时接受它，分别称为 一型和 二型错 
误。虽然这些错误是不河避免的，检验却可以设计得去控制它们 
的概率， 
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1* 由均数卩 》10 和 = 4 的 m 态总 体给出 一个大小为25的随机样本， 


求 


P 





2. 如果习趙1旳样本有5 = 12,求 

. Zw " 


问 ff 么是 P ( Z > Z*uOT 

3. 已知一个大小为 25 的随机样本是来自均数叫未知）和 a = 4 的正态 

总体。假设均数为10,而对它可能大于10#—定的关切 y 若 if = 12,计箅 

观察显著水平 * 问致据是否支持#的 裉设值 P 

4* 我们为生产与欧姆电阻器的生产线设计了一个抽样检査方案。我们 

取10个电阻器的随机样本并计算样本乎均电阻如果我 

们接受# = 5的原假设。如果 H - S | >0 + 5，我们接受备择假设和乒心 

a* 如果 4, 计算显著水平;即巳知只= 5 和 <7= 4 时，计算 P<|E- 
6(>5)„ 

b , 在 < r =*4， 计算接受原®设的概率当兴= 6，即在给定私= 6和<7 = 4 
时计算 P (| 元 

5-是否 《 + tf = lT 为什么是或为什么不是？ 

6. —计箅中心的穿孔操作者声称至少有 90 «的穿孔卡片不含错误。 
—个怀疑的中心使用者从一天的工作中随机地选取10张卡片而发现三张有 
错误。对 JR 假 ® + 和备择假设 P >( K 10， 其由 P 是错；误卡片所占的 

分数，计算观察显著水平 

7 + 比习题6对计箅中心作较大的研究^随机地选取100张卡片而犮现 

15 张有错误。应用中心极限定理求的概率，其中 

■- ■ ■ -■ 

„ IS^IOOP 

加 = ^ looPa^ff r 

并且 P = o . io , 数据是否支持计箅中心的声称？ 

8, 如果男的和女的出生是等可能的话， §17.1 中 Arburtmot 的数据 
将成 为十分 惊人。考虑一组不那么垴人的数据，假定在 82 年中仅 62 年男 0 

出生超过女的出生^对 M 假设■和备择假设■，计算观察显著水 





平， 应用习题 7 中 z 统计 a ， 在 p =| w 求 

3. 用混有 15% 花生粉的面粉所焙制的忪饼给一个 16 人小组尝味评 
分。对一个松饼十个特征的每一特征按五分评级制打一分数。然后对每一 
松讲记下全部十分特征的平均分数，这16个分数是 3.1, 3.2, 3.1 ， n 
2.9， 2.6， 3.0， 3.2, 3.7，3*9， 3.3, 2*7， 3 U . 4, 2.8 和 3.3, 用^ = 

0,05,对备择假设#异 3.0 检验原倀设/* = 3.0 ( 珥粉 h 接受或拒绝原假 
设。 


10. 某一银行提供几种不同的往来胀，并对一个支票账户平均日结存 
500美元不征收 费用。 因为支票账上结存不算利息，一种设想是客户试图保 
抟账上结存尽可能小到所要求的结存。一个快速检査支粟账的结存给出下 
列十个日平均结存数 I 491， 523* 486, 494, 532，564，488, 422, 562， 
和 W 1, 用 Cf = 0.05』 对备择®设/*>500检査原假设/* = 500,接受或拒 
绝原假设 9 

11在某一大学中学生的成绩是按每一课程评定的。在一个大的系里 
平均教师的评分年复一年都是大约在加个高年级班组里评分是 
3力5，3*31，3*34，3.82，3.30，3*16，2.34， 3.10, 2.90, 3.18, 2,88, 

3 + 22，3.28，3*34，3 + 62 ? 3*28, 3*30 , 3 H 3.54 和 L 30* 对原假设 
私= 3.25 和备 择偯设 /*>3.25,计算观察显著水平数据是否敦师对高年级 
的分数更*些这种想法给予强烈的 支持？ 

12. 在鬼节的晚上一个居民点的人《 数了 一下到他们屋子来恶作剧或 
远足的孩子数他们认为某些孩子是从另一城镇到他们的屛民点来的 。 数的 
数3是88，112，96，92，93，98, 89，101, 8&, 94, 95, 68, 72, 102， 

94, 81, 84, 85，92, 87， 76* 和时，对均数为84和均数更大一些的 假设， 
计算观察显著水平。 一 

13* 某一州的州髙等敎育梦调部希望了解入学人数的趋势。24个大学 
报告了入学人数比前一年的变异6这些变异是224, 208，-111，362，1'5， 
-76, ^ 282, -106，104, 172, 一 Id -222，500, 46 # 215，178， 

337, 206, 79, 42, 39，162，-317，和 -22 S 。 这些数据表 示真正 的入学 

人数增加呢还是减少？对作 一 t 检验以检验均数为零的原假设 。用 
«-0.05 

一昆虫学研究工作者在构造一数学摸以描述棉花象奥虫对棉株 
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的影响。在 生长季 节她度 fi 毎夭每 一棉株 开花的朵数。在某一夫，数目是 
42，26, J 5， ]9，27，32，26，2八 17，19，22， IS , 24，16，14，50， 

22, 25, 27 和 2%她想用20作为这一天平均开花朵数。这是一个合理数字 
吗？依据 t 检验作 出你的答案， 

15* —园 艺学家 进行- 个暖房实验来研究浇水率和施肥率对菊花株的 
效应。 在季节 的末尾 ，他度 ft 每一株上花的最大直径*直径按时是 6^, 

e i’ 5 i ， 7 盖 ’ 5 H ， 6 1’ 6 +* 6 j， 7 +，*i 和 

时 S 大花朵平均1：径为6 吋的原假设和更大一点直径的备择假设，计算现察 
显著水平* 


暑 
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演讲 18 


估 计 

18 + !两个使士，对心地、瑾慎地、信任地投資在，明确地说， 
Dawes-Toomes-Mousley-Grooms 忠诚可靠银 汗， 

摘自 Mary Popping 著 ^Fidelity Fiducial Bank”. 

虽然 Jane 和 Michael Banks 井未被 Dawes 先生说服有 
此需要把他们的两个便士投资于这家银行，但千百万人确然倌縯 
和相信银行及其他受托组织。在本讲中我们将讨论用我们认为值 
得信椟的方法所作的参数估计。 

18*2 在较早的一节中，我们说点估计是由样本数据算出确 
定的值用来作为出现于总体概率分布中参数之值的过程 P 点估计 
理论的发展基本上开始亍1的0年代费希尔的工作。费希尔在两 
篇主要论文[1， 2] 中清楚地叙述了估计问题井发展了几种度置一 
个估计好坏的方法。另一种说法是他发展了几种度量我们对一个 
估计信赖程度的方法,我们将只讨论估计两种特性: 无鴿性和最小 
方 SI 性。 

18-3 在较早的一节中，我们证明了 S 抽样分布的均数是总 
体的均数心我们说 * 是 M 的一 个无* 估计以强调 i 的这一特性。 
按这种专门的意义，无偏性与公正或不偏袒毫无关系。如已经说 
的，它仅仅意昧着一切可能的 i 的平均 值是# 值，这个^值正是我 
们所要估计的，或者用符号表示， 

x = Ave ( x > 

另一神口头表明这一特性是说平均说来5将给出 M 的正确值。 
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用更一般的符号,如果奴读成0尖角）的一切可能直的乎均 
值等于 h 即如果 

Ave(^) ^9 

我们就称#是0的一 个无偏 估计。作为无偏估计的另一例子，考 
虑样本方差 s s 。 我们 早已证 明迓,在从一个无穷总体中抽样时 ，一 
切可能值的平均值等于总体的方差（7、所以我们说 P 是 n 
的一 个无偏 估计。 为了引起那些开始觉得他们已掌握这一思想的 
学生们的注意，我们要指出却不是 a 的一个无偏估计 

假定我们要估计一公共汽车停车站排队的平均长度我们可 
能随机地选择一周的某些时刻，并点数一下这些时刻排队候车的 
人数; 得到下列数据：10,2,15, 2% 7,0,5,3,3,13。从这些样本数 

据，要估计一周内平均队长这一参数 I 应怎样做呢？我曾问过好 ' 
几班初学的学生这个问题。回答最多的总是用 = 样本均值= 
6^6或者用 A = 3<除去那个可疑的大数23之后的样本均值殊 

估计 I 样本中位数 1 = 7*5 也常被提出。 

没有关于总昧 频数分布的进一步的 假定，我们只能对样本均 
值声称无偏性 3 如果我们假定分布关于0对称， 那么义 和心都 

是无偏的， 虽然& 看来是一合理的特殊途径来估计9,但它一般 
是偏小 一点。 


给定了一个参数的几个无偏估计，我们需要另一准 
则来比较它们并选择它们。在分布关于0对称(例如疋态>的假定 
下，考虑色和心的抽样分布。我们可以描绘这些抽样分布如图 
18.1。虽然两个估计都居中于真值上，但&的抽样分布更集中一 
些，所以要被优先采用。 

给定了两个或多个无偏估计，一个明显的比较它们的方法是 
比较它们的方差。有最小方差的估计一般将有一个最集中于的 
抽样分布，因此将被优先采用。一切可能无偏估计中有最小方差 
的估计称为 最小方塞无期估计， 有时称 为最佳 估计。这个最隹一 
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Bte.i 估计的比较 

词应审慎地使用。有时一个新手可能错误地理解它是一切方法中 
最佳的而不是一切无偏估计中方盖最小者. 

样本均数毫无疑问是估计总体均数最常用的方法。不管总体 
分布的形式如何，样本均数是无偏的，不但如此,如果总体为正态， 
样本均数是最小方差无偏估计。 

对排队候公共汽车的例子，总体是正态或甚至对称都是不大 
可能的.相反，分布可能偏向右方，有许多小数目和几个大数 目1 
在这一情况中，样本均数是无偏的但不是最小方差无偏的。没有 
进一步的假定 t 我们不能说最小方差无偏估计是什么， 

W.5 —个很自然的方式表示对一个估汁的相信程度是给出 
一个 E 间，在此区间内我们合理地相信一个总体参数位于其中。 
例如工程师们通常加上或减去一个10%的误差作为一个安全因 
子，我 们现在 要学习 T 个简单的概率论证并给出从中得出的几个 
不同的理解。假定我们从一个均数为^和方差为 aKa 为已知但 
M 为未知）的正态总体中得到一个大小为 n 的随机样本。现在从标 
准正态表我们可得 

P (^1.96< Z <1*96) = 0.95 

我们还知道 
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o /^ 


是一个标准正态变量，因此 


i * 


< y ( s / 


<1* 


96 ^ = 0,95 


对括孤内的每一项乘上 a / ri 便得 

P ( — 1 ,96a/ V^n ^ x ^^ 1, 9^a/^ n ) =0*95 

下一步，我们从每一項减去 S 以得 

P( '2 - 1*96<7/>/^"< -5 + 1.96cr/v / "n ) = 0,95 

最后 * 乘每一项以- If 把不等式倒一下以得 

P(x — 1^ 96a/^ n ^/i<x + 1. 96a n ) = 0^ 95 

这样，我们得到由 i £- l _96 a / v /7 到元 + 1 •卯 < r /7 i 的一个区间 

作为 〆 的一个估计* 


18,6 1930 年费希尔发表了一篇名为 *I nv erie ProbabiHty v 

的论文 [3], 在其中他引入了倌念概率的想法从而得到倌念区 H。 
大约在同一时间，奈曼发展了置傕区间的想法。亶信区间的想法 
于 1&32 年第一次出现于 PytfcowsU 所写的一本小册子 [5] 上。在 
接下来的十年左右的时期内，许多书和文章都认为置信区间与信 
念区间是同一概念,不过名称不同罢了。伹当费希尔和奈曼完成了 
他们想法的发展的时候，逐新弄淸楚信念区间和璧信区间是很不 
相同的。 

对 §18*5 中所得到的区间5±1, 96 <7/^7,信念区间的解释 
可概述如下， 

1. 概率是对样本中所获得的指定£值而言的。 

2. 概率的陈述是在取得了样本和算出 S 值之后提出的。 

3. 概率是对一个固定的 参数# 的值的信念表示。 

为了对比，对此区间的置信区间的解释如下， 

1，概率不*对样本中所获得的指定5值而言的。 
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2. 概率 W 陈述是在取得了样本和算出5值之前提 出的。 

3. 概率是按公式算出的区间将包含参数^的相对頻数。 

就这个例子而言，清楚的是，差别是解释的不同。它是有关概 
率的两种不同想法的结杲，这两种想法我们以前说过 :概率 作为相 
信-度 的一神度量和概率作为一物理系统的一个特性。 

费希尔信念概率的概念没有普遍地被接受。相反 ， Neyman 
的置信区间的理论却变成非常广泛被人们熟悉并且很广地讲授。 


18*7 近年来 m 叶斯置 倌区问 日益受人欢迎。就 §18*5 中的 
例子而言，贝叶斯的解释与信念的解释是相似的。概率的解释是 
相信程度的解释,而对关于 M 的区间（云- 1.96 crA /" iT ，5 + 1.96 cr / 
v / I ) 的信念 9 5%则是* P 落在区间内 v 这个胨述的相信程度的度 
量。虽然概率的解释对于贝叶斯区间和信念区间都是相似的，但 
求得区间的方法是很不相同的。贝叶斯区间的求得是在抽取样本 
之前指定;*的概率分布再在样本抽得以后用贝叶斯定理修改这些 
概率。 


lift Kempthorne 和 FolksU ] 给出另一神略为不同的拫 
据数增求得值区间的方法。由检验一个原假设出发，在图纸上描 
绘出 i 著水平(简记为 SL ) 对的可餌假设值的曲线。钶如，假定 
我们从均数 / i 为未知而方差 (7 a = 16的正态分布中抽取一个大小 II = 
2 S 的随机 样本。 在 HW = S 的假设下，我们从一个 
标准正态变量超过 〆 的概率来算出显著水平，即 

SL = P[ !Z> IWU-M 0 )Ar i] 

给定了样本数据，我们对任何指明的样本可以计算显著水平。假 
定我们得到元= 10,那么对 

SL = P(| Z| >0) = 1 

对 

^ 0 =12, SL = P[ |Z !> |v/25(10-12)/4 |] 
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=PC \z |>2.5] 

= 0,0142 
对 

〜=9， SL-PH |Z |> ， | v ^25(10-9>/4 r n 

=PC [Z >1-25] 

= 0*2112 

按这样进行,我们可以绘出显著水平相对于心的曲线如图18_2, 


SL 



S ■ 2 协调区间 (Cousojoance intervals) 

给定了任何显著水平，我们可以得到 / i 值的一个集合与数据 
相协调。 KempthorM 和 Folks 称这类区间为协调8问《 

鲔此得到的区间与置信区间完全 一样， 但解释则不同*无论 
如何，图 18*2 中的曲线是值得画一下的& 

18 9在本讲中，我们提出了一些关于点估计和 Kfflft 计的 
基础概念^这些概念对初学统计的学生好象袖象一些 * 他们还不习 
愦考虑其他估计。然而很明显，在全国关心的事物（如空气污染、 
原子放射、能源供应、等等 >中，从同一组数据用以有许多不同的估 
计。在本讲中，我们要强调一种估计方法的好坏不能由它对单独 
一组数据的表现而决定*相反，方法的好坏必须依据它在更广范 
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围内的一些特 性 4 用概率的相对频数这个解释，我们来研究许多 
可能样本的表现，有了相信解释的度量，表现就可在更广一点的 
概率模型的基础上来判断。在两种情况中，我们必须考虑比观察 
所得单独一组数据更多一些， 

小结 。 点估计是一种计算程序，它由样本数据算出一个称为 
估计的特殊值，用作一个模型中的参数值。一个估计的好坏不能 
从单独一个样本来判断 f 它是从估计方法在一切可能样本的全体 
中的性态来决定的。 

一个无偏估计是用这样一种方法获得的估计，它使得一切可 
能值的平均等于待估汁的参数。在一切无偏估计的那个族中，具 
有最小方差的那一个称为最小方龜无供估计 & 

可信参数值的区间有时称为区间估计。在 1930 年代的早期， 
费希尔和奈曼独立地提 出区间 估计的构成。费希尔的狺念区间附 
带着一个关于指定样本参数值的概率陈述。奈曼的置信区间附带 
着一个关于指定参数所处区间的概率陈述 9 贝叶斯置儋 E 间在箝 
神上很象信念区间，但它是用员叶斯定理求得的。 
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习 题 

1. 从你班级的学生中选择一个随机 样本* 对这个班级的会体学生的平 
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均身*作一无偏估计， 

2. 设 t。 是表上一个 “Student* 的 t 值使得 

P< - toCtCto) =所需要的置信度 
例如，在自由度为15和所需置信度为0.95, to=2,13U 由 

P (- to<^r=<to) = 所需 S 信度 
开始，经过与 §1S.5 中相类似的步骤以求得置信区间公式 

sitos /%/^ - 

3 -用习题1中所收集的数据，求平均班级身商如％置信区间， 

4* 园艺工作者总是赶他们地区的平均无 S 日惑兴趣*在某一城市中， 
气敢记录的査阅给出二十年中一年最后一次杀伤性霜冻日， 


3月10日 

4月15日 

4月13曰 

4月22日 

3月28日 

4月24日 

5月6日 

4月5日 

4月18日 

5月2日 

4月5曰 

4 月 9日 

3月26日 

4月14日 

4月17日 


假定从1月1日算起的霖冻时间是按 正态分 市着的，求平均无霜日的邱％置 
佶区间。 

5. 环堍保护局曾对空气污染物质建立一个最大允许增加的水平，在 
某一城市中，最大允许24小时的增加是每一立方米91微克在城市中10个随 
机选取地点的测 M 显示下列2 4 小时的 增加： 89,92,84,60*76*94,78,79, 74, 
S 1* 对以小时的增加求的％的置信区间，你是否想城中污染程度超过了标 
准？ 


6, 这一习题可说明无偏性概念。考虑一个有限总体 * 4,2d5,l, 8。列 
出全部10个由此总体不放回,大小为3的可能抽样。对每-可能的样本，计 
鈐样本均数，样本中位数和样本方差3、 

a. 用证明10个5的平均等于总体的平均来证明样本均数是总体均数 
的一个无偏估计。 

b> 相似地，证明样本 P 是总体 S 2 的一个无偏估计。 

c. 相似地，证明样本中位数不是总体中位数的一个无偏估计， 

d . 证明样本 s 不是总体 S 的一个无偏估计。 

7. ―小城镇的一家公用公司开展一次运动以帮助居民们节能<»公司的 
一 队人员来到响应进行家庭能£调査的人家，并记下了恒温器上所定的温 
度。它们是78,69,73, 70,67,68,69,71,66,68,70,65,71,67,68,72, 69* 73, 

以和 70( 单位$华氏）。对平均恒温器上所定的温度定一个卯％的置信区间， 
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—个全 W 的悦收改革问题已向选举人提出，并进行了一次地 K 调 A 
以了解选 举人的 意向.在一个50人的随机样本中，打人赞成,21人反对这一 
提案。估计一下赞成人所占的成数，并对赞成人的成数作一近似95%的 E 信 
区间。 

S . —轮胎制造商对一种待殊型号的轮胎销售衰退极感忧虑，因此对过 
去 4 年中买过该型号轮脍的人进行调査 & 问他们用上这种轮胎到换上另一 
种型号时为止的服务哩数 * 所报告的服务哩数是 

22,325 24,320 18,260 20,200 

24*350 35*000 19,700 22,500 

23,250 24,000 23,000 21*900 

对平均服务哩数，计箅一个95%的 K 信区间。 

10. 〜家具木工在厨房用柜子上一关键的承受重思：的连接处用了一种 
新的胶水，为了使他确信胶接处的力蛩还做了一些试验。他胶按两块木枳在 
一起，然后加力使胶接处断开 & 使10个胶接处断开所加的重贵是545,4沾， 
625,530,585,615,580,615,590和540 (单 位为磅)。对使胶接处断开所耍求 
的平均重量，计箅一个95 %的置信 E 间 

■ n . 从一个峨市的电话号码簿上隨机地选取10页。在这10页上的名字 
数是3 9 &*41 2 ,388, 4 22,396, 42 0, 4 10, 4 郎，3& 2 和 3 95。对这一本900 H 的屯 
话号码薄中每一页上平均名字数计箅一个95%的置信区间。 

H 估计一下本书中习题部份所占全书印刷材枓的成数，计箅一个 
区间，并讲解你的方法》 
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演讲 19 

二元正态分布 

1**1 大亨成于山间不能成于闲市 

William Blaifi 

看一下 Georgia 州 Stone 山的等高线图<图 19.1). 不难想 
象一个光滑的圆形表面和一条陡坡在山的北面。尽管提供的信息 
不象三维槟型那样,但一幅等高线图能帮助我们想象地球的表面。 
用 地图来 思考地球表面这一事实提供一个描述二元数据的有用方 
法，这样的数据来自总体，它的每个成员由两个变董表示。 

i-p 

19.2 二元頻败分布 对描述二元总体是有用的。表 19.1 是皮 
尔逊和 Lee[2] 所给出的许多二元频数分布之一 e 虽然表中的数 
字基本上是頻数，由于有小数值，它们需要作一些解释。这些数据 
原来记录到最近的英寸区间 * 当一个个体落在一个小区的边界上 
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时，它的 M 数朽平分给相邻的两个小区 6 为了说明这一思想，考虑 
表 19.2 中的三对父子 ， 父子对 （68.5,76.5) 的频数1平分给上、 
下、左、右四个梠邻小区，每个小区摊得须数 0.25, 这样就产生了 
表19.3,实际上，这些小数频数就心记录在表 19.1 中的值。 



表 19. 2频数 




+ 

父 


子 

67-5 〜 6 S .5 

$«.5 

6 B + 6^69.5 

■ 

76,5 

715〜?7 + 5 

1 

1 



*10.3 频灸分摊 





父 


子 

67.5 〜63+5 


6£ L 5 〜6&,5 


1 + 25 0.2EJ 

76 , 5 ^ 77.5 1,25 0 + 25 


19.3 设想在表 19.1 的每一小区的中心竖起一条与该小区内 
的频数成正比的铅真线 & 如杲把铅直线的顶点连接起来就得到一 
个象山的表面的曲面，图 19.2 中美观的图是由 Yule 和 K en dall[5] 
给出的。 

19 + 4 考虑我们剛刚描绘的总体不是父子对的总体而是 
美国儿百万父子对的总体。再进一步设想所列出的高度是量到设 
近的十分之一吋而不是量到最近的一吋 s 等等。对于这神二元频数 
分布，我们造一个三维图，如图1 9 ,2所示。当度量做得更精确时, 
所描绘的曲而将变得更光滑，能够想象，其极限曲面将象图那 
样。 
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BUS 父子身高致据的頻数曲面 



- m i ».3 频敎面曲的极限形式 

许多二元数据集能很好地用图 19.3 那样的曲面来描述，并称 
它为二元正态的。有时，我们宁可用等高线图来描绘这类曲面， 
这种等高线图常常看起来象图19.4,它包含着一些同心椭 B 。 

我们将不介绍二元正态的数学公式。目前我们要指出下列一 
些特性 t 
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ffl 19.4 等高钱图一二元 IF _ 态 

x . 二元正态分布曲面是一个钟 形曲面 ，它关于二个变量的均 
数都对称 & 

2_如把所有的频数都归并到一 条轴上 ，就得一 条一元 正态曲 
线。例如，在父子身长数据中，只管父亲的身长而不管儿子的身长 
并把全部频数都归并到一边，便得到父奈身长的一个正态分布 

与任一 变童轴垂直的任一平面内的截钱也是一个钟形正 

态曲线。 

W a 〗 ker [4] 认为 Adrain 是第一位作者早在 18(^ 年就提出二 
元正态分布。 Walker 还提到拉普拉斯 Plana (1812)， 高 
斯（1823)，和 Bravais (18 46 ) 得到一个现在称之为二元正态分布 
的公式。皮尔逊 [1] 认为高尔登 (1885) 是把二元正态曲而看作描 
述观察变量的第一个人。然而 Schols ( IS 75) 讨论过用二元正态来 
描述火炮射击的水平和铅直误差。髙尔登的工作是十分重要的， 
因为它标志着统计学中使用二元正态的主要开始。 

小结使用等离线团去描述山地曲面提供一个有用的对比方 
法去考虑二 元数据 的分布。这种二元数据是从观察总体的每一成 
员的两个变量而得到的。组，组 区间， 和组标部是对每个变量定 
的。二元頻 数分布 是通过每一组对的频数记录形成的 • 

把每一个二向小组(小格)的频数作为纵坐标值画出就能得出 
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—个二元颃数分布的三维图。这时总体曲面楚容易想象的6 

二元正态分布有一个钟形曲还有 ， 假如考虑每一条适上 
的频数，边缘分布是一个一元正态 & 平行于任一轴的截面上的条 
件分布 m 是正态。二元正态的等高线是同心桷圃。 

二元正态的起源已较模糊，但至少早在1308年就已知 ii 了* 
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习 


题 


1. 画一张类似于图 IS ,2 的图常能得到较好的理解对下列汽车引擎方 
面较 小的二元数据集，构造一个频数曲面 


净转矩 


19 S — £00 
200—205 
扣5〜210 

aio^ais 


los^ioa 


m 〜 in 


ui 〜 m 



2. 重复皮尔逊和 Lee 的调壺。试得到100財父和子或100对母和女的 
身 s , 构造一个象表 m 的颏数表再作一张象 ra 19.2 的频数曲面。 

3. 用徒手画法固出表1 9 +1中频数 3 0, 2 5, 2 0，15,和10的等高线 & 这些 
等岛线祖看起来是否象橢圆？ 

4. 一个大学的系正在执行学生对教师的评价，并备有一批有橡皮头的 



々泛笔。一个统计学学生注意到，较短而用得较多的铅笔也有较短的椽皮头 a 
测 g 500支铅笔铪出以下数据。 


忪皮头长 ( 1 / 16 吋) 


铅笔托（吋> 

0〜1 

1〜2 

2〜3 

3〜4 

2〜3 

16 

9 

5 

S 

3〜4 

12 

+2 

13 

& 

4〜5 

36 

88 

37 

10 

5—6 

7 

30 

&2 

16 

6〜7 

6 

8 

40 

20 


构造这一频数分布图。画出这一频数分布的等高线图^ 

5. —邮购商行分析了从大量邮购顾客所得到的订货单。对于同 M 订购 
衬衫和鞋子的顾客，记录了衬衫尺寸(袖长)和鞋子尺码（投度 ) fl 




n 

衫 

尺 

寸 


眭子尺码 

32 

33 

31 

35 

36 

38 

7丄〜8 

2 

42 

20 

1 

4 

0 

0 

a — ^9 

2 

切 

86 

42 

17 

0 

0 

十 10 

$2 

101 

68 

SO 

23 

0 

10— 

2 

15 

76 

[ 2 % 

sa 

13 

I 

11—^12 

2 

0 

0 

70 

10 S 

4£ 

a 

12含〜13 

0 

0 

S 

69 

86 

so 

1314 

0 

0 

0 

10 

20 



画出频数分+图，作频数分布的等高线囹^ 

6, —杂货超级市场经理用饳祈的会计制扠能分析研究各种的关系 研 
究总杂货账和 肉的数 i 的关系给出下列分布。 
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肉账 (美元） 


总 

账 

(美元） 


0^20 

20 〜 4D 

40 〜 60 

60〜80 

£0 〜 10Q 

0 〜 10 

G0 

42 

37 

12 

6 

16^-20 

£5 

3S 

62 

50 

60 

20^30 

0 

11 

40 

56 

53 

30 〜 4Q 

0 

1 

22 

32 

39 

画出频数 分布图。 
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演讲20 


相 关 

ZU * 1最后，一天早晨，在 Ramsgate 附近一个路边车等 
候火车并全神貫注地阅读我 笔汜本 中的图表时，我忽然感到等《 
数线构成同心。事例太少了不足以肯定，但我习惯于这类事物 
的一双眼睛使我相信，我正在接近于问恿的解决[1]。 

高尔登在他写的 Memories of My D / e [ l ， 302页]中给出 
了他是怎样披导引到我们在上一讲中所遇到的同心機 B 族的叙 
述。高尔登继续谈到他向剑桥大学 St _ Peter 学院导师 J _ D . 
Hamilton Dickson 请教产生这类同心椭圆的二元正态的数学公 
式》 

20 2 如果我们要想懂得一点高尔登 (1 S 22 〜1911)，有必要 
具备一些直线和椭圆的初步知识 & 

直线（任何直线)的方程具有形式 ' 

Y = a+bX 

其中 a 和 b 为常数。常数 a 和 b 有简单几何解释。常数 a 是 Y - 截 

ffi , 即原点到直线截 Y 轴处的距离。常数 b 是直线的斜率， 

罚节 _ 两点间的铅直差 ~ 

&率-两点间的水平差 

囝 SO . 1中给出三条直线，读者应当验证斜率与截距是象所给 
出的一样。 

在 】 9讲中我们注意到父子频数数据的等高线是同心椭圆。有 
一点椭岡方程的知识对理解相关系 数是十 分有帮助的。多数学生 
了解一个椭圆是一个蛋状的卵形图，但并 f 诘任何卵形都是椭圆 0 
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画椭圆的一个有趣的方法是把一根线的两端固定在一张纸上（线 


Y 



BiO . i 直线的例子 

略为松一些），用一枝铅笔绷紧，并在线保持拉直的情况下移动沿 
笔，如阌 2 C .2 所示。 



两条对称 轴 < 更通俗地说这些直线在椭圆内的部份 ) 称为 长轴 
和 短轴， 长轴是两线段中较长乳短轴凫较短者* 

中心在原点的椭圆的一般方程为 

其中 
* 180 * 





AC ^ B E >0 

具体的椭圆是通过对 A ， C ， D 指定不同的值而得出的。例 
如，设 A = l , B =0, C - l , D = 4,我们得到一个中心在原点、半 
径为2的圆。 


20.3 现在遵循高尔 登标准化我们 变量的步骤，通过对二 
元正态的抝圆等高线的考察，我们能得到标准化变量之间关联或 
相关的一个很_单的度量。设标准化变量为~和以，于是这些等 
高线由椭圆方@ 

Z 1 ， 2p2iZ a + zl = D 

给出，其中 

^ 1 -p a >0 

根据不同的 D 值，我们得到一族椭圆，与图 20*3 中的椭圆同心 * 
若 p 为瓦则长轴取 OB 方向，若 P 为负，则长轴取 OA 方向，若 
为0,等高线为圆。因此 p (读做罗）称为相关系数，它提供标准 
化变量 h 和^ (因而非标准化变量 X 和 Y ) 之间关联的 一种度 

若 P>0, 当 Y 变大 时 ，X将趋向于大。 若 p <0, 当 Y 变小 
0 扎X趋向于大。若 p 接近于 + 1 或-1，关系是十分密切的，这 
种 情况图 示于图 20. 4 :1 中。 





0 20.3 二元正态的典盟等商线：标准化变扔 
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ft p 的解释 

20-4 我们已经把相关系数 p 作为二元分布公式中出现的一 
个参舉来讨论对楠圆等高线形状的影响给出了两个正态变量 X 
和 Y 之间关系的一神思想方法。还有一种描述 P 的方法，对于二元 
正态总体它等价于已经给出的方法，对于非正态总体它同样有效。 
皮尔逊 [2] 通常被认为是把相关的使用拓广到非正态总体者，并常 
称这一提法 为皮尔 ** 积矩相关。 

考虑一个总体，在其中大的 X 常与大的 Y 相关联，小的； S 与小 
的 Y 相关联，用标准化变量^和表示，散布图将如图 20. 5所 
示。 ^ 

在第一和第 H 象限中，乘积 Zl & 该是正的，在第二和第四象 
限中，该是负的。因为第一和第三象限中的点子比第二和第四象 
限中的多，平均 (期 望）乘积该是正的。如果散布的点子倾向于有 
一个负的斜率， la 的均值该是 负的。 取平均乘积作为关联的度 
置于是看来是合乎逻辑的。在许多数理统计学的书中证明，如果 
我们有一个二元正态，这平均乘积完全等于前面定义的 h 即 
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2 1 -0.4 

5 6 0-6 

1 0 —14 

4 8 16 

2 2 -0+4 

总和12 17 0.0 


0.16 5,76 

0 + 3 & 5-76 

1-96 11.56 

2. S 6 21.1$ 

0 + 16 l .»6 

5 + 20 47-20 


n 


參 


9 


9 


鲁 


癱 


擎 


奉 


* 




# 


_ 


• * * 


* 


ill 


p 

:: 


* 


酱 

* 


鲁 




* 


g 


毒 


IV 


用原始变量， 


p 


asv . s 乘积矩相关 

P = ZiZ 2 的总体平均 

— AvetziZj ) 

AveCX-zirKY-^v) 

<y xtr * 


20*5 给出一个样本，估计 p 的最明显的方法是计算样本等 
价物。用 r 表示我们的估计，令 

( l / nJSfX ^ XKY ^ Y ) 




^( X - XJCY ^ Y ) 




例 


X Y X-X Y-? (X —X)(Y — V) <X-X) J (Y^) 
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66666 o 

9 5 7 3 5 2 




X = 2*4 


Y = 3.4 


15.20 _ 

^"( 5 . 20 ) ( 47 ^ 20 ) 


= 0,9702 


20 *e 设 X 与 Y 是取自二茺正态，容易检验原蟫设 

Ho: p 0 

相对于备择假设 

只要算出样本相关系数并与表 A + 6 所给出的值作比较。 

拥对§20,5中的例子 ， r = 0. 9702。从表査出 n = 之 

值为0*87%由于计鉢值超出表中值,我们结论说在0,05水平下， 

p =^0 fl 


小结为了寻找两个变量之间关联 的解释 ，髙 尔登引 进丁相 
关系数。 相关系数 P 有一个裉自然而简单的 解释， 作为产生二元 
正态分布椭圆等高线方程中的一个参数。若 X 』和 x 2 是密 切关联 
的，并且趋向于同时增加(或减少)，等高线是长而扁的椭圆，其长 
轴具有正斜率的解释看来是合理的。方程给个接近于+1的 
值。若 和1 是密切关联的，并且当又1减少时，又 1 趋向于增 
加， 这 时椭圆长轴的斜率是负的旦 P 接近于 - 1。 

皮尔逊把相关的使用推广到非正态 总体？ 由于这一理由，相关 
系数常被称为皮尔 逊乘积 矩相关。 

样本相关系数是十分容易变异的，所以小样本的推断是难以 
置信的。检验 p = 0 的假设在方法上是很容易的，但要求较大的样 
本，推断才有价值。 


> 参考文献 
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习 题 

1. 给出下列直线的方程并作图 

a , Y - 截距= 3,斜率； 2, b . Y - 截距=-2,斜率 = 3. 
c . 截距=-3,斜率 =-4+ d t Y - 截距 = -4* 斜率 =-2* 

2. 对由标准化变置 z , 和以所给出的椭圆方程 

zi - 2pziZj + z 卜 1 

在々=-0.5， -0.2, 0.2, 和 0.5 时作出草图。 

3. 两今邻近城市的电视观众注意到，两个城市的天气预报有时是明 S 
地不同，然而，他们的经验指明一个城市的天气十分相似于另一城市的天 
气，下面是两个域市24天的中午温度 < a F ) 读数。 


X 城 

Y 城 

X 城 

Y 城 

SO, 2 

83.5 

07] 


83.1 

£8.0 

97-3 

101.2 

82,3 

85.7 

91-3 


87-3 

94M 

SO. 9 

93.1 

S9.1 

93,2 

51.4 

54. 7 

88,7 

39.6 

92,3 

& 6. a 

90-2 

94-5 

90 0 

94 』 

95-3 

盹 ，7 

B9-5 

91.5 

98.4 

101-6 

8G.4 

&9.S 

98*7 

103.6 

S4.7 

87.1 

98.6 

■m+3 

35.8 

R0.8 

O&i 合 

99 + 2 




a . 计箅相 关系数 r 。 

b * 应用表在0,05的水平下， 检验假 
c. 画出温 度读数 的散布 图> 
d * 如何描述两城市溫度之闻的关联？ 

m 

4. 用卫星数据来估计不同使用 土地的 面积。在 12 地块估计种植 小交 
的土地的百分数，和从地面记录 所获得 估计记录如下 
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地 }■ 


工足致据 





23 

36 

35 

23 


30 

38 

£2 

34 

Z9 


a* 讨算 r. 

b . 检验 Hvp = 0相对 

5. —个室内装饰家购买白铜烛台。他很快就知道价格与烛台的年龄之 
间#在一种关联，下列数锯给出 X = 价格(美元>和¥ =年龄(年 )， 


#5 

5 

12& 

1如 

165 

170 

140 

150 

120 

125 


计算样本相关系数 r ， 并应用 or =0.05 检验 

6-在一拥挤的敎学大楼里电梯承受繁重的服务6在课间休息时，等候 

上去的 A 数为 X ，等候下去的 A 数为大楼工程师收集一些等候人数的 
数据如下。 






计算样本相关系数 r ， 弁在 a = 0.05,检验假设结果合理吗？ 

7 , 对某特殊职业进行一次薪水调査》调奋（在其他变镫中> 年 K 和年 
龄 A 所得的数据如 下1 

5龄(又厂 — 「 — (千美元） 



48 

56 


34 

35 


计箅样本相关系数 r ， 并在 a = 0*05,检验 = 年蘄和年龄之间钉关 

联吗公 
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演讲 21 


总体回归直线 

2 t ,1 Forrest [1] 对高尔登的广阔兴趣和活动作了 一个良 
好的叙述。在他四十几岁时，高尔登把他的精力转向于人类遗传 
学的研究，在研究过程中他不仅对遗传学也对统汁方法和理讼作 
出贡献。 

高尔登在 价 [3] 中，描述了一个使他为难的问题。 

如果一对夫妇所生的于女平均说来相似他们的父母，怎么 T 
能使一个人类总体，作为一个整体，在连续好几代中，保持他们 
的騎征不变呢？他们的子女不是相同的而是有变 异的： 因此，比 
他们的平均高度，有的高一些，有的低一些；所以在高大夫妇的 
于女中常常有一些更高大 o 反之 f 对矮+的夫妇也可能有更矮小 
的亍女，但是从我至今所能发现的看来，比父母更例外的后飼杖 
为少见。 [3] 

在 18 S 0 年代不可能得到代表一个人类总体二代人的数据，在 
Joseph Hooter 爵士和达尔文的建议下，高尔登决定用香豌豆 
做实验 


21*2 在1885年髙尔登选取大量的豌豆种子，并把它们分 
成七个不同的重量组、随后他说服居住在英格竺各地的朋友们按 
照一组细致的指忝种70联种子，每一重貴组中取10颗。每一次 
收成连同叶簇都送回给高尔登，提供给他两代香琬豆的详细数 
据，实验的详细内容发表于 18 S 7 年 [2 ] fl Forrest 把这一实验的 
主要结果给出于表 21.1 中_ 

• H 



上一代 15 

下一代 IS . 4 



香 域豆实 


种子直径 (0 01时) 



166 


20 

17*0 


ir*s 


注意，小个子琬豆的下一代没有上一代那么 4 s 而大个子豌豆 
的下一代比上一代较小些，高尔登称这种现象为回复变异[2]。他 
说; “回复变异是理想平均子型 〈下 一代)与父型 〈上一代) 有差异的 
趋势使回复到可以粗糙地也许正确地称之平均袓先型' 髙尔登 
以前曾用过回归一词，并且从此以后就恢复使用回归这一术语0 

如果我们用和 Y * 表示标准单位的变量(由减去均 
数再除以标准差得到），髙尔登所观察到的现象 q 用图21，1来说 
明。数据点 P 和丫，并歹分布于线 AB 附近而趋向于分布 
在直线 CD 附近。经过 &察他 的原始数据和在朋友们的数学帮助 
下,他犮现可以通过二元正态的拥圆等高线给出一个合理的说明。 


y T 吓卞代> 



S £ i.i S 尔登的相关呀 

在图21_1中我们已经显示出用标准化变量表示的二元正态 


_ 






分布的典型椭圆等高线。长轴沿着45°线 AB fi 萵尔登作与椭 
圆相切的铅直线，切点为 C 和 D , 联 C 和 D 。 类似地，水平切线 
产生直线 EF 。 理由如下，对于任何固定的 X % Y / 的条件分布是 
具有以最可餌值为均值的正态分布*因此，对于一个给定的 X % 
切点给出条件分布的均值。由于椭圆等髙线是同心的，全部切点 
在一直线上 * 从而我们得出这个了不起的事实. Y / 的条件分布的 
均值在直线 CD 上。类似地， Xf 的条件分布的均值在直线 EF 上 
上述注释对统计学的使用者来说其意义是，对二元正态分布 
所产生的数据存在三条可能的总体回妇直线^如果( X 、对是 
从总体巾随机选取的，我们大概会对直线 AB 感兴趣。如果 X /值 
是指定的而相应的值是观察得来的（如上一代——下一代数 
据)，我们会对直线 CD 感兴趣并称它为 Y 对 X 的回归。另一方面， 
如果是指定的而 X /值是观察得来的，我们会对直线 EF 感兴 
趣，并称它为 X 对 Y 的回归。 、 


21.4 按标准化单位， Y 的均值作为 X 的函数，其方程是 
通过变換,我们可以得到用非标准化变量表示的方程 




Y =^lY 






/ix +p 


X 


用较筒单的记号，我们可能愿意写成 

Y = g+j3X 

不仅对回归且对一切条件分布都进行如图 21.2 那样想象总是有 
益的。 这样，对每一个 X ，存在一个具有均数 a + j 3 X 、 方差/的 
Y 值正态总体。所有的均数都在直线 Y = t a + 在 X 上，并且每一总 

-m ， 



体的方差都适相同的。事实上，因此， Y 的条件 
方差比 Y 的无条件方差在数 量上少 pVS 而在比值上少了 V 成。 
这一点常被给予重大的意义（特别在社会科学统计学中），并把 
pi 称为由回归所 ( SI 明的变异部分。 



5 尽管二元正态在回归的研究中有历史的重要性，但它 
不再起一个中心角色的作用。通常并无必要去假定一个二元正态 
总体。合理的倒是去假定对每一个 X ，存在 Y 的一个正态总体，它 


们的均数在一直线上，且假定一切 Y 总体的方差都是相同的 



小结，0归一词与过点群作直线之间的模糊的联系可以通过 
研究高尔登对这一词最初的使用来说明。他观察到在许多实例 
中双亲的特征趋向于传给子女，但有回复或回归到整个总体均数 
的烏势，这个词就逐渐变成与各种类型的直线数据联系起来。 

由二元正态分布所给出的数据，有三条感兴趣的回归直 线:椭 
圆的长轴，连结水平切线切点的直线，连结铅直切线切点的直线。 
这些直线有下列的统计解 释：随 机选取 ( X , Y ) 对的回归直线，在捶 
定的 Y 下随机选取 X 的回归直线，和在 指定的 X 下随 机选取 Y 的 
回归直线。 
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这些解释的最后一条特别受到注意，可重述如下。对每一个 
X，存在 Y 值的总体，其均败为 a + 汉X和方差为常数 a、 

参考文献 
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勒让德 

的 

最小二乘方原则 



演讲22 


* 


最小二乘方论 


最小 二乘方 法为科学家们知道已200多年了，并己成 
为用曲线和方程去拟合数据的主要方法。近年来大量的研究工作 
指向寻找更好的拟合方法，但最小二乘方仍占优势。或许这是因 
为这个思想一旦掌握，看来很直观。 

在一些极简单的问鹿中，最小二乘方法看来不是别的而是选 
择最直接的解。几年前我听到 George Polya 敦授在 Oklahoma 
州立大学的一次演讲中所举的如下例子。如果你把一$牛空运到 
湖中心，并把它放在那里,它将取什么路线游到湖边？ t 

我没有研究牛的这种反应，但看来合理的是，大多数这种“哑 
巴》动物将宁可游向例如 A 点而不是15点<图 22*1 K 还有，看来 
合理的是,所选的期边目的地将在最接近于游泳出发点 [图 上坐标 
( x ,， 3^〕的附近。在使离狒边的距离极小 ft 时，假定我们的牛懂代 
数，并假定它知道从 （ W 0 到的距离是 

D <Xi-x a ) 2 

要使距离极小化，它只要选取使 D 极小化的心, 显然 ，如果 



m ：2, i 鼓小二乘方法 
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0 & 是 极小化了的，那么 D 也是极小化了的，因此不需耍考虑平方 
根，所要求的就是选择(&，：^>使得 

( x 1 - x 2 ) 1 - J -( y i 

达到极小。 称这为 最小二 乘方法(实际上平方和的极小值)看来是 
很自然的。 

22*2 为了使槪念成为有用，必须推广维数。几何解释对三 
维配合得裉好，因为在三维空间，^，^，。和^“^^^两点间 
的距离是 

'/ < 〜 一 x 2 ) a +(y] - y *)* 屮 d - z 2 > a 

而最小二乘方就是极小化平方根下的量 。对 于髙于三维的情形我 
们增加平方根号下的项数，伹是这时的几何解释是纯代数的，用二 
维和三维的图象以帮助想象。 

a 

2 i *3 高斯被公认为最小二乘方法的发明者。然而，看来它是 
在差不多同一时期为髙斯,拉普拉斯，勒让德，和其他人所发现。根 
据 PlacfceU [2], 最小二乘方法是勒让德在“确定彗星轨道的新方 
法 ” （Nbttuelfes methods pour to determination des orbits des comet- 

從>中首次命名和发表的 • AbbeEl ] 认为方法是髙斯早在 IMS 年 
发明的,伹为勒让德于1806年首次发表的。 Abbe 接下来论证说 
Robert Adrain 独立地发现了这个方法，并于 18 C 8' 年发表在 
Analyst 杂志上作为响应该杂志一个有奖问题的研究* 

最小二乘方的基本概念可以(和应当）撇开过去用来达 
到极小值的各种方法而被看到*所用的具体的极小化方法可以是 
十分复杂的，要利用非线性规划的算法，也可以是相对地简单，只 
要利用一年级微积分就行了。更简单搜,可以只用代数，或 ra 无需 
任何数学的试错法来达到极小彳!^给出极小化方法的全面评述不 
是本讲的目的,但对极小化过程有一些了解还是需要的。因此我们 
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将给出一些炤初等方法求极小值的例子。 


22^5考虑统计学中最简单的问题之一。已知II个观察值来 
自具有均数为^的总体，求出^的最小二乘估计9也就是求出使 

一 ” + (X 广扣 + …+ ( x fl - 彥 >* = 

达到极小的 P 的值。根据初等代数，我们重写这个量如下* 

S ^ ) £ = - s + x *- A >* 

IbT *=l 

= S(x i -£> a + 2(S-4>^(x t -x)+n<S»M) a 

现在，因为 SKxr 幻 = 0, 我们有 

(■1 


S(X| —=» S(Xj ^ S ) 4 + n(x -P ) 1 

i-i 卜 i 

方程右方第一项不 含乂而 第二项显然在 $ = 5 时为最小。因此 ，^ 
的最小二乘方估计由 P = 5 [给出。这样，最小二乘方法给我们用样 


本均数 去估计 总体均 数这一直觉上合适的处理。而且这一结果是 
通过初等代数得到的 t 


22, e 考虑另一个用初等方法使平方和极小化的例子 t 在快 
艇赛中，有效时间（用来决定最后阶段>是通过用去的时间乘以船 
的一个等级因子而得到的。设 

Y= :有效时间 
用去的时间 

于是 


假定某一特定的船巳参加过五次竞赛，并设它用去的时间与有效 
时间都是已知的。记录如下农 6 我们要利用数据去获得於的最小 
二乘估计，也躭是，我们想要按照船的等级因子来使极小化。一 
个简单方法是 通过试 错法来进行， 






X 

Y 


2-1 

3,3 


Z.2 

2,& 


3.4 

3.6 



7*1 


S.2 

5,8 



S = S < Y i * i 3 X i ) a 

察看数据使人想到， |3 约为 1*1。 从表 22.1 可以看到, 我们的 
第一次试验 0 ^ UI 是十分接近于使 S 极小化。因为) ffX 的三个 
值太小，两个值太大，我们可试一下略大一些的0值。这样经过试 
错法，能眵找到具有所要求位数的最小二乘估计。 




表 22.1 

试算 J?=l,l 


X 

Y 

I.1X 

Y-i , IX 

(Y-UlXP 

2.1 

2.3 

2,31 

-0*01 

Q.0001 

Z.Z 


2*43 

0.13 

0.0324 

3.4 

3 6 

3*74 

-0*14 

o,m 邮 

6-4 

7-1 

7.04 

0.0ft 

0 .0036 

5.2 

总和 

5.S 

5*72 

0-0S 

0.0064 

0*0621 


22*7 尽管我们可以用微积分来得到刚才考虑的例子的最小 
二乘方公式，但这是不必要的，事实上 * 我们可以用初等代数求得 
如下 

= SV - 2^2 Xi Y , + 沪 sv 

现在把#作为变量，含 X 和 Y 的暈作为系数来处理，配成/3的完 

全平方。 


• 198 * 




S = SX^ ^-20 








_< sx ^ i > 

_~ SXT 


+ SY . 3 


(: SXW 


显然，上一式的第一项，从而 s ， 在 J 0 = SX . Yy ^ x , 1 时达到最小, 
并且最小值是 


SY 


因此，最小二乘方估计是 


* 




( SX ； O s 

sx ， 

SX . Y , 

~^F 


表 22 , 2 给出获得於的计算。可见试错法的结果事实上是很接近的 

表 22.2 最小二乘方计算 


4 


X 


Y 


2 


XY 


2.1 


骨 


2,3 

2.5 

S 3 

7.1 


S + 2 

总和 


0 


99,17 
88, S 1 


4+41 

4.84 

4.A3 

S.5Q 

H -S& 

12.24 

切 .9£ 

45. U 

27-04 

3&.16 

88. «1 

93.17 

=1,1054 



总之，最小二乘方法能使一个合适的平方和极小化。有 
谇多方法能用来实现极小化。 


小结在十八世纪宋，十九世纪初，商斯，勒让镰，拉普拉撕 
和其他一些人推 广了最 小二®方法。尽管在努力寻找更好的方 
法,但它仍然是数据分析的一个基+方法。 

直觉上就是一个定点到一个区私的最短距离。由于解析几何 
学的距离公式取为平方和的平方根，最短距离就是通过一个极小 


彆 
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化平 方和而 得来。很自然地称这个方法为最小二乘方法。 

^的最小二乘方估计是通过对^使2(\-幻 2 极小化而求得 
的。可以见到用几种不同的方法都在 A = $ 处达到最小。因而样 
本均败是总体均数的*小二*方估计 a 

给出简单回归模型 Y Hfi 的最小二乘方估计要求极小化 

这给出 3 = SXY / SX \ 通常把 X 点在水平轴上， 
Y 在铅直袖上，因此极小化的是铅直偏差的平方和 。 
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i + 通过经 a 学习可很好地理解最小二乘方 & 考虑衫2.5中的问题。已 
知数据 ft , 10,12,9,21,对 /**10，11，12，13， H , 计昇 S = 对不同 

的只画出所算得的 S 值的图。泠的什么值#来会使 S 极小？ §22,5指出的是 
什么值？ 

2, 对？=1*00，1.05，110，1.15，1.25,算出 §22.6 中的 S 。 画出 S 相对 
于彡的图^卢的什么 tt 看来会使 S 极小1 

3. 在工程方格子图纸上绘出下列数据， X 在水平轴上， Y 在铅直轴上* 

■ _ 

X Y 
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用一支直尺，画一条眷來是合理地穿过数据的直线。 跫出 你画的直线的铅 
直饴笔，并计荈偏差的平方和。重复这一过程直到你觉得可以相信，你的直 
线泯接近于 E 铅直偏差平方和达到极小的直线为止。 

4 . 用 Y 作铅直坐标，作出下列数据的三维图4 


Xi 

x 3 

Y 

1 

2 

£1 

1 

% 


1 

4 

2» 

2 

2 

24 

2 

3 


2 

4 

32 


画一个看来是合理的平面，量出到这平面的铅直偏差》并算出偏差平方和, 
按这一方法继续下去，用试错法找出使偏差平方和达到 最小的 平面， 


演讲 23 


回归参数的估计 

23*1 在前而几讲中我们介绍了 总体回归直线 的思想 并切入 
了最小二乘方法作为估计总体参数的一种方法。在本讲中我们将 
举一数值例子以说明许多公式。 

23*2 我常常记录下我的班级里学生的第一次和最后一次考 
试分数。这些分数常常呈视出遵循简单的线性回归模型。下列数 
据摘自一个大班的考试分数 U 


第一沈考试 <x) 

最后一次 I ,试 ( Y ) 

63 

65 t 

65 

7 S 

72 

70 

73 

70 

BO 

81 

«5 

7 ft 

86 

若9 

&3 

■ 

81 


我们将假定 


Y = jS 0 + jBiX + e 

并假定误差 e 是独立同分布的正态变量，其均数为0,方差为 
现在我们将结合这一例子给出 （1) 札，此，和 V 的估计, （2) 忒和 
么的 方差，（3〉氏和 A 的置信区间，以及 <4)凡和氏的显著性 
检验等的公式和计算的说明 # 


* 
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23.3 在表 23 」中我们给出全部以后要做的计算。当然，现 

在已有许多能给出表23.〗中各列和的计算器可用。有了这样一台 

计算器就无须把单个数据写入表中。从各列和可得一组驻本量 t 

617/8 = 77*125 

Y = 621/8 = 77.625 

S ( X - X) a = .2 X a -( SX)Vn 

= 43,377-47,586,125 
=^790,875 

2( Y - 卽 =SY 、 (SY”/n 

; 48 s 547- 48, 205,125 

= 3^1.875 

SCX^JCXY - Y)-SXY- (SX)(SY)/n 

= 48,323-47, 894,625 

= 42 S .375 

3fe25.1 线性回扣计其 


XY 


ea 

GS 

3,369 

4,624 

i.284 


75 

4,22S 

5,625 

4p&75 

72 

70 

5*184 

4^900 

S.040 

73 

T6 

5, 320 

5,776 

S.&48 

SO 

81 

G, 400 

6,561 

6, ISO 

S5 

7* 

7,225 

6> 084 

16 卯 

36 

89 

7,396 

7,921 

7,654 

93 

Si 

8,649 

7,056 

7p&I2 

总和 617 

S2t 

48, 377 

48,547 

4 艮 323 



23.4 下列公式给出利用 2 S 讲中一个极小化方法所找到的 
凡和氏的最小二乘方估计 

古 ^S(X^XXY-Y) 

Pl ^~ S ( X - X ^ ~ 
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^c-Y-^X 

对考试分数的网子，我们 fR §23*5 中所获得的量算出 


iSi = 


42S.375 


790*875 


= 0*5416 


此 = 77.625-(0.5416)(77. 12 导 ) 


= 35*8541 

因此，最小二乘方直线由方程 

Y =35*8541 +0.5416X 

给出，这一方程与原始数据一起阃在图 23,1 中。 

Y 



3 2^1最小二乘方直线 

要理解图23,1中直线是什么，可能没有必要通晓计算的细 
节。目前有许多计算器和机算机程序可用来直接给出見和見•我 
觉得学生在受教育时应当把计算细节从头到尾搞几次，不应当允 
许计箅掩盖最小二乘方直线的基本性质 s 即它是这样的直线 + 离这 
条直线铅直 ft * 的平方和最 /Jv 


23_5 这些离差怎样呢？它们可以通过计算直线上的 Y 值, 
用會 （ Y 尖角）表示，并从所对应的观察（实际）值中减去兮3出 
来々表23,2给出这些计算。作为计算的验证， t 的总和必须等亍 
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Y 的总和，所以偏差的总和必须为零 & 由于舍入误差，可能出现微 
小的差异。表 23*2 的最后一列是偏差的平方及其总和 * 实际上， 
这一总和更容易从公式 


得到,它给出 




— SdX ” ~ 


2d 1 *109*8470 

与表中所得的一样（除了舍入 误差〉 


4 I 2 S .2 铅立偏差 


X 

Y 



d 1 

63 

68 

69*97*9 

-1.9Zi9 

3.9002 

6& 

75 

71^05^1 

3.9419 

15.53 邱 

72 

70 

74.B493 

-4.6+9J 

ZZ*SiST 

7Z 

76 

7S. 390ft 

(hem 

o.m» 


81 

79.1821 

1*8179 

3.3049 

65 

7S 

B1.S901 

-3,8^01 

15-1329 

«« 

«9 

82.4317 

$.5683 

43,1426 

93 

84 

86.2229 

-2.2229 

U4U 

ft 和石 13 

各 21 

621.4000 

0.0000 



统计争中通常用的#的估计是 

O t = ^/( tL - Z ) 

= 109 , 8470/6 
« 13.3078 

除数 n - 2应作一些说明。一般说来，估计 V 的除数等于^减去 
確定均数所需要的参数个数，在这里，爲和氏是在一个特殊 X 俥 
下确定 Y 的均 数的南 个参数 ，所以 除教是 n -2* 

最小二乘方估计克和見是由 数据算 出的，在从同一 
总体的重复取样中它们不是常敢 * 因此我们对它们的方差感兴趣， 
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这些方差在理论统计学中被导出，为 






a a SX a 

nS(X - X ) 

a 1 


p S ( X - X ) 1 

因为 (7* 未知，表和 A 的方差都是未知的，但我们有^的一个 
估计，因此能估计札和咸的方差，用如 1 和邛 , 2 表示这些估计的 
方差。这些方*估计为 

^ n 2< X - X )* 

M (18.3078)(48,377) 

* — <8)(790.m> — 

■ 139 , 9836 , 

略 * 豆 x : x ” 

丈 18.3078 
配 790.875 

■ 0 * 02 於 


佶计的榇准畫为 


政彎 \^39_ W 3 ff 

* U < S 315* 

略 *0.1523 


«. T 本讲的目的是要读者了解一下计算，但所计算的量的 
某些漘释似乎是必不可少的 • 对这一例子中的戌没有物理解释 
可给。它仅仅是截距的一个估计。就本例而言， Y - 截距是所 
有在第一次考试中得零分的学生最后 一& 考试的总体平均分数 • 
对于大多数班级这不是一个有宽义的概念。. 

另一方面，久给出第一次分数的每…单位变化所对应的最后 
—次分数的变化的估计*第一次分数每增加10分将对应于最后 
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—次分数增加 5*416。 

从图 23.1 显 然可见，数据 在最小二乘方 直线周 围存在 很大的 
变异 。 这一变异导致 A 和 A 的方差相当大的估计。 由于吣 = 
11. S 315, 我们可能有理由以30或 4 <)作为札的可接受值 * 还 
由于城== 0,1523,我们不应当过分重视最小二乘方估计表= 
0.5416,只 应认识到真值可能略 有一点不同。 

一种较严格的雄理合理的札 和氏 值的问题是用显著性检 
验。对于原假设 

及相对的备择假设 


我们算出检验统计量 


- K 




査自由度为 n -2 = 6 的 t 表，我们算出显著水平 

SL = P( |t| > fU ) 0 ) 

对于与札有关的原假设，我们作类似的计銲 * 


假定我们有 


于是 


所以 


= 0,9297 

咏 . 


SL = 0.39 


因为这是相当大的值，我们发觉此的假设值与数据十分 一致。 


«,8善于思考的学生显然看到 A = 14不是唯一与数据 

■ . 

相-致的值。一个推荐的方法是对反的不同的假设值算出显著 


0> hb * 是用观察值算出的 t 值.一译注 


，如 7 • 





性水平 SL ， 并绘出 SL 相对于假设值的曲线，由此曲线可得到与 
数据相一致（或相协调)的值 * 

大多数教科书只对一个显著水平提出这种区间 * 例如，如果 
我们确定一个显著水平0.05,区间为 


对目前的例子，它是 




或 


0*5416+<2.4469)(0.1523) 


或 


0.5416±0,3727 
( M 689 到 0.9143 


2**9 最小二乘方 ® 归直线有广泛应用，留心的学生将发现 
许多例子*例如 * Hu me [ 2 ] 给出 Binford 所得到的表5^ 中烟斗 
柄数据的方程为 Y = 193K85^38.20X, 其屮 X 是斗柄孔的直径 

而 Y 是年代 。这方 程能用来鉴定直径可度量的烟斗柄碎块的年代。 

在一本名为办 [6] 的书中，给出了与臂骨和腿骨长 
有关的人 体高度 的回归方程，尽管获得方程的数据浚有给出。人 


类学家可利甩这些方程从一根骨头的尺寸来估计一个人活着时可 
能的髙度， 


Ni 0 l [5] 利用一条最小二乘方直线来研究水貂寻找食物的行 

为。他找到了搜导时间 的长短 与下一次捜寻时间间两的一个线性 
关系。 


作为最后一个例子，我们提到 Lave 和 Seokiti [4] 的文聿，其 
中讨论了用回归把空气污染对人类死亡率联系起来。 


小结 兹就® 单线性目 归模型 

来说明参数的估计，计算置信区间，和进行检验等计箅细节, 
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札和爲的最小二乘方估计为 _ 

甙 = Y -氏 X 和見= ^]( X - X )( Y - Y )/ S ( X ^ X ) 4 

^的估计为铅直偏差平方和2士，被 n -2 除。式和忒的方差佑 
计 s 以和 sp , 2 的公式也被给出。 

於0和氏的置倍区间分别$ 士 t 0 . oi 5 S “和 士 
截距和斜率的假设值的棕^龙通过 t 检验进行的，其 t 值分 


别为 


和 


fit h 

S^i 


在两种情况下自由度都是 n *2* 

还给出了在考古学， 人 类学， 动物行 为和生 态学中 的例子 * 

参考文献 

I 

J. Draper N + ,atid H.SmUh. (I960) Applied Regression AfKy w ysit 0 Wcw^Yoi-ki 
Wiley, 

2 h Humfl, lyor Noel, (1970)^4 Guide to Colonial Artifacfs t New York -Knopf* 
Kempthrtrne^ O., and L + Folks- (1971) Probability, Slntisfics t end Data 
AmJysis t Ames ： Ix>wa Stat^ Press. 

4 - Lave, Lester B. F atid Eugene P, Sts? in. (19r Wpldemiulogy 』 Causa(ty, rmd 
Public Policy ^American Stietiiisf, 67,178-18G* 

5 Nigel, Dun st one B 0 9TS)^The Fishing Strategy of the Mink, n Behavior t 67,1&7- 
177. 

G r Nours^Alan E, (1964)Tfte Body w New York ： Time. 


习 题 

1. 从 1911 年到1975年一哩赛跑的创记录时间如下 t 


191J 

4:15,4 

1945 

4H 

1913 

4:14.6 

1954 

3 ： 59,4 

1915 

4：126 

1954 

3 ： S8,0 

1523 

4U0.4 

1957 

3:57+2 

193] 

4=09.2 

195 8 

3=54.5 

1033 

4=07.6 

1962 

3-54,4 

1934 


mt 

mi 

1937 

4 ■ OS + 4 

10C5 

3 ■& 3-6 
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1942 

i'QS,2 

1966 

3:51+3 

1942 

4=04.6 

19G7 

3:S1.1 

1943 

4*03.6 

1975 

3:51-0 

1944 


197S 

3U9.4 


a + 把时间换箅成 秒。 

t >. 绘创记录时间 ( Y > 相对于年 < X ) 的散布 图。 

c . 假定直线模型 + + 估计^反，和 

d . 对 -0,4 和算出显奢性水平， 

e. 预澜 2000 年一哩赛跑的创记录时间。 

f. 你对用宜 线有什 么不同惫见？ 

2, 下面是 1976 Siatistical Abstract of the United 中给出的 

(美 圉)联邦我收总 Sfe 单位是十亿矣元。 


i»sa 

41 

19&9 

200 

l«SS 

72 

1970 

206 

1960 

100 

W1 

⑽ 

ms 

126 

i^n 

223 

i9&a 

165 

1973 

249 


I 狯税收 ( Y ) 相对于年汾 ( X > 的散布图* 

V 估计札，必，和 

C . 对和 H !* 札知 10,计算显著性水平華 

d. 预測 2000 年的总税收。 

e, 你对用直钱有什么不同意见？ 

S+ 算出表 5.5 中数据的最小二乘方直线。你的方程与 Hume 给出的 
方程一致吗？ 

对你班的每一个学生爱得桡骨(从肘到腕关节的臂骨)的长度 X 和身 
高 Y, 算出最小二乘方回归直线 & 

5+ 1965年到1972年(美国）联邦政府对国 防和® 伍军人福利拨款总数 
按十亿美元为单位列出如下 


S: _ R 



1965 

54 

1966 

& 2 

1S5? 

76 

19 & 3 

a& 

1969 

S8 

1&70 

8S 

1971 

B7 

1972 
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点出数 据 # 

b . 算出鋟小二乘方直线 a 


C . 利用最小二乘方直线，預测什么是 1 S 77 年的拨款？实际拨款是 119. 
6. 建筑一幢房屋所需的时间是复杂的，因此房屋的价格也是复杂的， 
下 列数据表示完成时间以月为单位）和价格 Y (以千美元为单位)。 

X 

Y 

12 

14 D 

1Q 

60 

6 


T 

«o 

10 

to 

n 

no 

IZ 

139 

s 

TO 

7 

«0 


利用最小二乘方直线，如果承包商估计建筑一幢新屋要10+个月，这幢新屋 

大概应值多少钱 7 

7,回答一次市场调査，一些汽车驾« 者报 告他们力求保持的轮眙压力 
和阐来轮胎所行驶的 哩数。 用 X 记以磅为单位的平均压力，用 Y 记录 行驶里 
数(以千哩为单位)。 


X Y 


29 

S2.S 

28 

31.« 

31 

25.0 


2«,3 

27 

£1.2 

26 

20.8 

30 

24.0 


a . 算出最小二乘方直线。 

b , 检酴原假设 A = 1.0 相对于备择假 设凡手 1.0。用 = 
c ， 在 29 磅压力下，你期望能行驶多 少哩？ 
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演讲24 


预 测 

24,1在上一讲中我们主要关心的*获得最小二乘 方直线 
的机理，尽管我们也提到根据数据形成关于诸 J 3 的合理值意见 
的方法。 

回归直线的十分重要用途之一是预测未来的 Y 值。作为例子 
或可能的例子，我们列举(1>从入学考试分数 X 预测大学绩点平均 • 
Y , 从能力测验分数 X 预测推销员的生产率，（3> 从定量饲养 

的曰数 X 和一些其他因素，预测牛的体重増长 Y * 最合理的单个 
Y 的预测值就是 

我们也可能希望给出合理值的一个 E 间。 

第二个问题涉及对一指定的 X 值估计 Y 总体的均值。单个估 
计值仍然是 

但是一个合理值的区间就和我们感兴趣于单个 Y 值的情形不同。 

对于23讲中考试分数的例子，我们可能对第一次得70分的学生 
总体的最后一次考试的平均分数感兴趣。这显然不同于对第一次 
考试得70分的单个同学的最后一次考试分数感兴趣的情况。 

第三个问题是 H 时给出所有 Y 总体的均数区间。这等价于指 
定这祥一 个区域 使得整条真固归直线在有合理的保证下位于这一 
区域中。 

第四个在某些应用领域中很重要的问题是对一已知 Y 值估计 
—个未知的 X . 这就是所谓的榇定 ( calibration ) 问题①，这是以 

® 亦称控制问鼉，参俾茆诗松、丁元，周纪罗、呂乃刚 （1 如1>«回归分析及其 
试验设针*.上海华东师港大学出板社，页21〜26_ 译注 
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如下方式提出的。在一些样品上取得两种度量又和曾 4 度量 X 是 
相当精确，但要取得它是困难的或昂贵的 a 度量 Y 的精确度较差, 
但是容易或并不昂贵地取得。得出最小二乘方直线良 X , 
并用它来对未来的样品的 X 值依据度量 Y 进行估计 


24*2 假定一个教师曾方 m 几个大的班组，讲授好几年同一 
课程，他用了标准化考试并得到了一条有关课程平均 <Y) 对第一 
次考试分数的回归直线。 一 个学生在第一次考试时得了 70分，想 
退出这一课程。教师用回归直线和学生的第 一 次考试成缋去得到 
这个学生的课程平均分数的琢测区间 T 区间的端点是 

0. +^tX± ua/i ⑴ 

其中X。=感兴趣的X值（这里是70)， u 是自由度为 n -2 的 
Student t 分布表上值，其他量足从回归数据算出的。 


我们用23讲中的数据怍出全郤计算，这里让那个从数据得来 
的 Y 表示 f 程平均分数，于是 I 

X = 77*125 X ) 2 =790, S 75 

n=» ^ = 18,3078 

^ 0 = 35*S541 A =0.5416 ， 



( X 0 -^) a _ 


1,0905 


所以一个 9 S % M 测区何的端点为 

35.8541 +(70)(0,5416) 士 <2,4469)(4, 2788)(1.0905> 

或 

73,766±lK4lrS + 

或 

62+348 S 和 85.1834 

因此该莩生的£5%预洌区间是从 62.3488 到 35.1834, 在实际 
情》中这抒一个预测区间可以在劝告^个学生时起作用 & 学生可 
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能十分怀疑我们预测最后分数位于指定端点之内的可靠性。我们 
可以告诉他或她(在给出的假定下），对初次分数70的学生，所有 
这种预测区间中95%将包含他们的课程乎均。 


M .3 假如我们不想为单个学生进行预测，而想估计初次成 
绩为70 分的全 体学生的平均课程分数，非常直观地感到我们应 
该有可能把平均分数的位置定得比单个学生的更精确些。事实 
上,在已知 X 值时 Y 总体平均是 

立即看出这一公式与 前一令 中的公式几乎相同。仔细检查发现, 
前一公式中根号下的被去掉了。所以根号下的量变小了，因而 
我们 对兮加 上和减去一个较小的量去得到置信区间的端点，对 
95%置信度进行计算，我们得 



因此我们的区间端点是 

r 


7S*7661±(2 • 私 69>(4*2783>(0,4350> 




或 


73.7661 土 4， S 5 M 


59.2117 和 78*3025 

在我们例子的上下文中我们有95%的频数在第一次考试得70分 
的学生总体的课程平均位于和 78.3025 之间，所以， 
事实上， Y 总体均数的区间比单个预测观察值的区间短得多 * 

F 


24*4 公式(1>和 (2) 都是准备用于单个 X 值的。如果要用于 
二个或更多个值，这些95%置信区间联合起来的置信水平就不 
是郎％，要对所有的 X ,即对 ft + AX , 建立 Y 总体均数的联合 
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置信区间倒确有一个公式可用，它就是 

先 + Ax 。 士 V 丄 + ^ y ~~ Jv 2 < 3 > 

n ^ j \ 入 X ) 

其中 F * 是分子自由度为2,分母自由度为 n - 2,在所要的置信水 
平下 F 表中所査得的值。 

因为这是第一次提到 F ， 作一些注释似乎是必要的。 F 分布 
集中于非负数上，并且是偏向右边,尽管起源属于费希尔[2]，但是 
苜先发 表的表有一张是属于 SnedecorLS], 并且分布广泛地被称 
Snedecor F 分布。表 A，7 列出这个分布，其中=分子自由度， 
h =分母自由度 * 

应当看到，如果我们想同时对凡+氏 X 的一切值建立置信 
限，所要求的置信区间应比只满足于对一个 X 值的来得宽些。公 
式<2)和(3〉的比较显示出情况确是如此。在公式 <3)中我们乘以 
而不乘以 t *。 $为大致与 U 相同，公式 (2) 和 (3 >i 
之间的主要差别是由决定的因此公式 （3) 所给出的区间至 
少比公式 (2) 所给出的要宽40%, 

对目前例子中又。= 70 作计算，我们得到在 95% 的置信水 
平下 =3,2073, 从而得出区间的端点为 

73*7661^(3,2073)(4.2788)(0.4350) 

或 73.7661-5,9697 

或 67.7964 和 79.7358 

小结隐示的或明显的，严格地或不严格地，囲归直线总是被 
用来预滅除了那些观察到的之外的 X 和 Y 之间的关系 4 我们算出 
了下列的置信 区间： 

(1) 对一个指定 X 的未来的单个丫值； 

<2)对一个指定 X 的 Y 总体均数> 

(3) 同时对一切 X 的 Y 总体均数 # 
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三个公式如下 


* V J n S (- X ^ x > 2 

(1) 

— V ft 

(2) 

i 

f 土 VTF 表 ( U ”- 

n S ( X ^ X ) 2 

<3) 


公式（1>所给出的单个 Y 值的区间比公式 (2) 所给出的平均 Y. 值的 
区间要宽些 。公式 (3) 所给出的整归直线的区间比公式 (2) 所= 
给出的单个平均 Y 值的 K 间要宽挫。 
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习题 

■> I 

1* 用 23 讲中习题 1 的数据，构造1990年一哩费狍 创记彔 时间的$5% 
置信区 间 （ 用公式<1)),用公式 （2) 和（3>构瑋1^0年创记录时间的95%置 
信区间：并给以说明， 

2 . 用23讲中习题2的数据，构造200(|年 f 美国）联邦政府总税收的 

95%的置信区间。 ’ … 

3. 利甩表 L 5 由的_据，构造烟斗柄孔直径为告吋的烟斗年代的 95% 
置信区间。 

4. 洧23讲中习规4的数据，构造桡骨为 II . 时的-■个人身髙的95%置 

信区间和桡骨为11时时所有 A 的平均身高的95% 置信区间。 ? 

5. —个办公室主管 A 仔细地检 S 不苘工作条件下打字员的工作，对几 
个不同的打字员记录了一天内平均每页的错误次数和那■一天办公室内平均 
湛度 （ °F >， 数据是 
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*8+2 
69, J 
65+fl 
68.2 

70.3 
68,7 

65.3 
69.2 

计算全体打字员的每页平均铕误数的 95 %置信区间和办公宽保持在华氏 
65“ 时单个打字员的每页平均错误数的置信区间。 

8. 在一家大百货商店全店商品减价出售，下面的价枯（美元)，是观察到 
的一个商品样本的正规价 (X) 和减价价 (Y), 



16,00 

13.SQ 

12.50 

11,00 


35 + ⑽ 

75.00 

42.00 

&9 + ⑽ 

47.50 

77 00 

42.00 

95,00 

57*50 

25 + 00 

20.00 

37,50 

2B^L 


Z9 r S0 


算出正规价为 $ 44 . S 0 的单个商品减价价的 95 %置倌 E ： 间 a 

^ —个月刊 杂志报导一绂典面城市的平均温度 CF ) 和平均相对 S 皮 

» sir ， 


5 2 
4+1 
i.s 

4.4 
3 + 6 
6.2 
*,Z 

屢 .6 



<%>0 计算具有平均月溫度为 60 ft F 的单个城市的乎 均扨对 湿度的 S 5 K 置 
信区间，丼中 X =温度，和 Y =相对湿度。 
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实验科学统计 




演讲25 


罗瑟姆斯坦特和艾姆斯的遗产 

25.1 John Bennet La^es (1814 〜 1^00) 爵士生于英格兰 
Harpenden 附近萝瑟姆斯坦特庄园住宅[2]。在牛津大学学习以 
后,他回到了属于他家族所有达200年之久的庄园，于 1SM 年担 
负起管理家族芘园之责。由于他对化学的兴趣，他不久就开始实 
验以研究化学盐对植物生长的效应。1842年他获得一项制 造过碑 
酸钙的专利，并于 1343 年在伦敦的 Deptford Creek 开设了他的 
第一家生产过磷睃钙的工厂。同年他任命一位化学师， J. H. 
Gilbert， 作为他的助手,并在罗瑟姆斯坦德开始系统地研究农作 
物菅养。 IMS 年在 Broadbalk 农田上开始对小麦的实验<滟续到 

今夫） 是涉及大多数生长在英格兰的农作物的许多实验中的笫一 
个。 

1889 年 Lawes 建立了 Lawes 农业信托社以保证罗瑟姆斯 

坦特的实验得以继续下去。他资助信托社十万英镑，并允许承租 
那块进行经典实验的农田100年。 

罗瑟姆斯坦特对农业科学的贡献是明显的。但是为什么一个 
偶然涉足统计学的学生要知道它的存在呢？因为1919年在那里发 
生了一件统计学史上非常重要的事件 一一 费 希尔来到了罗瑟姆斯 
坦德, 

2 S . 2 费希尔来到罗瑟姆斯坦特的历史是当时的主任 E. 
John Russell 爵士[ 7 ]讲的•他写道 [7] t 

忸是剑桥没有什么东西可提供给他，他于1913年离幵了。叹 
后两年他是不安定的；在1914〜1918战争时期他自愿报名参军， 
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钽是由子他的视力，他被拒絶了 t 他在加拿大的一个农场里工作 
过一个时期 Q 从 1915 到 1919 年他在不同的 公立学 校里教过数学 
和物理#在体质上他是不适宜于这项工作的，所以他在这方面既不 
价快又不成功。当我于 1919 年第一次看到他时，他正没有工作。 
在做出决定以前，我写给我熟悉的他在（剑 桥〉 Cains 学院的导 
询问他关于费希尔的数学能力、回答是，如他，坚持做下去，他 
能够成为一个第一流的数学莩，但不愿意。看¥他好象是我们所 
需要物 色的那种人，所以我邀请他参加我们一起工作。那时我只 
有200英锈，我建议他考虑这笔经费够用 > 久他就耽多久，并讳他 
在研究了我们的记录以后告诉我这 些记录 是否适宏于做正当统计 
分析和有无可能盼望产生比我们己经取得的信息更多 一些。 他每 
用在我家喝茶汇报情况，并且总是抱 t 同的态度。我不化什么时 
间 就认识到他比一个有 巨大能 力的人 还强： 事夹上， 他是一个天 
十， 必须留 下来。 


费希尔从到1 93 3在罗瑟姆斯坦特。在这十四年 
间对加速发展统计学学科作出了几乎不可限 £} 的贡献。他在理论 
统计学方面的文章仍然成为逬代统计学极大部分的基础。费希尔 
所创造的统计方法是全世界闻名的、采用的。他的书 
Methods for Research 在 1925 年出第一版，共出了十 

四版，最后一版是在1970年，是费希尔1郎 5 年逝世后出版的。费希 
尔的天才的巨大流露可由 Collected Papers of R ^ A.Fisher [1〕 看 

出，这是一部包括 三百多 篇独立文章的五卷本 & 对费希尔的工作 
很难作一全面概括/但在下几讲中我们所提到的许多实验设计思 
想可追溯到来自费希尔，或者来 自他的同事和 追随者。或许费希 
尔在罗瑟 姆斯坦 特的日子里给统计学（或再一般科学）最大的遗产 
是费希尔 在实验设：卜方而的 工作， 这可用他的文章 Arrange - 
邮拟 of Field Experimentsl43 和他的书 The Design of Experi- 
menf 4： 5 ] 作为例子来说明。 
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25.4 在大西洋的另一焊(美国 ）Iowa 州的艾姆斯 （Ames)， 
一 位年轻的数学副教授 George Waddell Snedecor 已对统计学 
❾兴趣 aSnedecor 诞生于年， Tenues see 州的 Memphis， 但他 
的童年和青少年的大部份时间是在 Florida 州和 Alabama 州汶 
过的。1905年他获得了 Alabama 大学的数学和物理学学士学位 
和1913年 Micliigan 大学的物理学硕 士学位 。在1913年他受聘 
为 Iowa 州立大学数学助教授，在下一年升任副敎授。 

在艾姆斯，随着对统计学兴趣的发展，他被委托教统计学的任 
务; 第一门统计学课程是他1914到1915年在数学系开的。 

本世纪二十年代初期， Snedecor 开始与 Henry A* Wallace 
协作，后行后来成为美国的副总统。在那时 Wallace 是 Iowa 
州 Des Moines 地方 Farmer 报纸的编辑井 对农业 科 
研感兴趣6 1924年舂 Snedecor 组织了一个在 Wallace 指导下 

的周六下午讨论班以研究多元回归和其他统计方法。 Wallace 和 
Snedecor 于 1925年发表的 Correlation and Machine Calculation 

就是来自这狴周六下午讨论班的。 

Snedecor 和他的同事们不仅在统计学而且在使用穿孔卡和 

多种穿孔卡机器来分析数据方面都起了先锋作用。这一努力导致 
1927年数理统计服务社和 mz 年统计实验室的建立。 

1931年统计学的第^个理科硕士学位授予 Snedecor 的学 

生 Gertrude Cox, 她愿意去 North Carolina 州建立统计研究 

■ • 

所继续她的工作。 1的1 年夏季 Snedecor 邀请费希尔到艾姆斯讲 

学。这一夏季学期在许多方面影响艾姆斯和全世界关于统计方法 
的发展 * 

1934年 Snedecor 出版了一本称为 Calculation and Interpreta ¬ 
tion of Analysis of Variance and Covariance 的书。 1937 年紧 
接着出了他现在成为经典著作的 Statistical Methods 一 书的第 一 ^ 
版。这卒 ~t 5 至今已出了六版 ， 第六版；与 William G，Cochran 
合写的，而且在1974 年奩 出超过I 27 , 000本。 
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Snedecor 的贡献是巨大的，艾姆斯的统计学科教育计划 ⑴ 来 
了全世界杰出的统计学家， Iowi 州立大学的统计系是美国第一个 # 

a 

小结罗想姆斯坦特实验站是 John Bennet Lawes 爵士建 

立在英格兰， Harpefida 附近他家的产 业内。 第一次对小麦的实 
验是年开始的。在 18 S 9 年 Laves 建立一信托基金组织以 
保证实验的继续。 

在费希尔到罗瑟姆斯坦特去工作时实验站 B 闻名世界 。 由于 
费希尔1919到1933年在那里的工作，这一声望包栝农业研究也 

包括统计学。在罗瑟姆斯坦特，费希尔既发展了基本统计方法，也 
发展了理论基砌。 

Snedecor 早在本世纪初期在 Iova 州立学院（那时还未扩充 
成为大学,——译者注)就开始对统计学感兴趣及一兴趣导致1927 
年咨询服务社和1933年统计实验室的建立。由 Snedecor 对统计 
学的兴趣，他于1931年邀请费希尔到美国 5 这一遨请对 Iowa 州 
立大学和美国的统计学有巨大的影响。 
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演讲26 

随机化 

26*1 假定有人找到一只遭受过一段时期凤吹雨打的指北 
针。由于锈蚀，针已不能转动。相倩针指向北方是合理的吗？假 
如有人在一森林中绝望地迷失了方向，他可能寄希望于指针是指 
向北方的。事实上，缺乏指北针知何达到它目 前状态 的知识，就不 
可能对指针现在所指的方向有强烈的信念。如果我们是在使用一 
只经过试用并作过鉴定的指北针，它的指针在轻轻转动后趋于静 
止时，我们将有完全不同的看法* . 

有时,当数据呈现出指向某一特定结论时,我们遇到一种类似 

的情况*费希尔觉察到随机化提供一种收集数据的方法-种 

“旋转指针 # 的方法，使所收集的数据能作出有力的结论。 

26 + 2我们假定，我们不是找一只指北针而是撖一个实验， 
以确定两种不同的肥料对小麦产量的效应。对三块试验田作处理 
1， T lf 对另三块试验田作处理2, T a 。 产量（蒲式耳/英亩 H 己录 
如下 


T t 

T , 

3C.4 

s&.r 

40-2 

39,1 

36,2 

36.6 


这张表除了指出在平均产量上有一个差异 ( K 53 蒲式耳，如何进 
行呢？数据是杏淸楚地指出处理2的优越性呢？我们不能确定， 
因为我们不知道数据是怎么得到的。也许处理2刚巧施用于较肥 
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沃的土地，也许施用处理1的土地刚巧紧靠一种争取性很强的农 
产物6 

—种形成正确意见的进行方式是考虑，如果处理是随机地施 
用于试验田上，结果将会怎样呢？假定这样做了，事 实上 〆 这样做 
就等于假定)处理】和处理2对小 麦产量 的效应是一样的。这时 
所得到的两种产量上的趋别只是代表土地的特性，而用 L 和 
的标志纯粹是一种 随机的 标志。 考虑 I 和0\对这六块土地上可 
能的 20种不同 的安排6表 26.1 中显 示出这 些安排连同所得到的 

*204 处理的酼机化（空格先用处娌 T 2 ) 


结果 36.4 40^2 36 + 2 3S.7 39*1 36 + 6 




12 





37,60 

33 ■ 13 

0.53 

Tj 



38 + 43 

37.30 

-1.13 


T t 


38.57 

37+17 

-1.40 



Ti 

37-73 

38 + 00 

0 + 2T 

Ti 



37,10 

36,83 

X + 53 


Ti 


37-23 

3S*&0 

1.27 



Tj 

36. ia 

39 + 33 

2.93 

Tj 

Ti 



37,67 

— 0 40 

T, 


Ti 

37-23 

38-50 

U7 


Ti 

Ti 

37,37 

3A-37 

1.00 

Ti 



33 + 37 

37*37 

— 1*00 


Ti 


38 50 

37,23 

-1 37 

■ 


T t 

37. 

as.07 

&+40 

Ti 

T r 


39.33 

36 」 

-2 + 93 

Ti 


Tj 

38-50 

37 + 23 

-1 + 3T 


Ti 

Ti 

3S.63 

37+10 

— 1.53 

T t 

Ti 


38.00 

37.73 

-0-37 

T t 


. Ti 

37.17 

IS, 57 



Ti 

Tj 

37 + 3fl 

S8-J5 

1.23 

T t 

T, 

t a 

38, 13 

ST.eo 

-0.53 


均数夂和 t 以及差 T^Ti 


n 
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当我们考虑能观察到的 20 个可能的差这一列时，实际观察到 
的平均产量的差 + 每亩 0.53 蒲式耳现在就更有意义了。首先注 
意，差是成对出现的，如0 + 53和〜0_53, - 1,13和1 + 13, - 1*40 和 

1*利，等等。这是完全合理的，因为，如果两种处理的效果是相等 
的话,差的符号纯粹是由于标志的缘故，一个随机的效杲。其次， 
20 个差中有^个的绝对值大于或等于观察差*即 

P ( 绝对差 > 0.531 效果相等 )=0, 80 
由于这么大的概率，处理效果相等的想法或假设看来十分可信。 

我们刚才傲的就是 U 讲中称为显著性 检验。 总的思想 
是想出一个检验统计量< 在这一例子中是均数的绝 对差) 并在已知 
原假设为真的情况下，计算统计量取值象观察那样不可能的概率。 
这一称为 M 著水平 的概率对原假设提供一个可 倌性樺数 & 大值支 
持原假设而小值倾向于否定原假设。 

应该强调，上一节中所傲的分析，对于不论处理朵如何施用于 
各试验田块，也能同样地做。然而费 希尔认 识到实际的随 机指定 
处理这一行动将使分析更有意义。它是怎样如此的还不清楚，或 
许它是心理上的 f 决不是纯数学的。我们要说，这是和指北针类似 
的。如果我们知道对所有的方向提供相同的机会，那个指向某一 
特殊方向的实验结果是更# 易被人 们理解的 # 


在已经说过显著性检验能提离正确性之外，随机化提 
供一个概率框架 （probability framework) 使我们能得到处理之 

差的无偏估计 * 并使我们无偏地估计处理之差的估计的方差。为 
丁理解这一点，假定我们六个田块上的基本产量 （ 即不施肥料可能 
得到的年产量〉是表26.〗中 所用的 产量。 再假定 处理]的效应 rj 
是每英亩^増加蒲式耳，处理2的效应是每英亩増加 3.0 蒲式 
耳，于是 T^- Tj 的加个可能值将是表2 6. 1中那些值加上 r.-r^ 
即这20个可能的差 将是】 . 53 ， -0,13, -0,40， 1 . 27 , 


• 227 * 




2.53, 2*2?，3*93, 0.60， 2 . 27 , 2.00，0.00* -0.27, 1.40, 
-1_93，-0,27, -0,53，0-73, 2*40, 2-13, 和0,47。全体 

叭 -1可能值的平均于是就是 =1.0 蒲式耳/英亩。随机 
%为我们做了些什么呢?它告诉我们一个明确定义的数字总体 
CT , ^ % 可能值的总 体〉， 它的均数 r ^ x , 就； Jik 我们感兴趣的参 
数。还有，我们实质上随机地选 取了钇 -1的一个可能值。在® 
复试验中，平均说来，我们得到^ _ n 之差。随机化就这样保证我 
们有处理差的一个无偏佔计。 

二十个差的总体的方盖是按公式加算出来的 t 
其中以代表一个典型的差，于是我们得 Var ( T 4 - T t ) =1.机正 
象随机化使得的一个无偏估计成为可能，它也提供我们 
1 ^汽1\- ; ? 1 )的一个无偏估汁。假定随机化给出表26,1的第一行， 
这时的结果将是 


T t 


T, 


38*4， 42*2， 38*2 41.7， 42.1， 39*6 

首先，我们估计来自 t 的观察间的内在变异并且来自％的观察 
间的内在变异。然后我们合并我们的估计。 

来自 T , 的 s | = 5*08 
来自1\的 si ^ i.ao 
平均 s ^3,44 

我们对 VaKTrT ) 的估计于是为 

|^*- 2*29 

26.5 总的说来，随机化增加了显著性检验的有效性，它提供 
了一个均数为 ri - q 和方差为 Vard^-tV 明确定义的总体，并 
且对处理之差以及的方差有无偏估计。 

我们已经说过应用随机化于实验设计应归功于费希尔然而 
从一个总体随机抽样这个思想在费希尔之前已经知道也已经用 
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了。例如， PeirceCl ] 描述归纳为根据一个随机抽取的样本对被抽 
样的全体的推理 b 他主张归纳推理的两条法则：样本必须是 
随机的； 对样本所要做的调査不能为样本的特征所限* 


小结对实验田块 髄机地 施用处理这一具休行动使得对观察 
使用一个概率模型合法化 * 

如果处理有相同效应，按所受处理来标志观察可以严格地认 
为是一种随机标志。样本处理均数之差司以纯粹由于选择特殊标 
志而产生。因此，去考虑全体可能的处理施用和考虑由一组给定 
的观察值得出的样本处理均数的不同值是合理的 & 这就导致一个 
观察显著 水平: 象观察到那样大的处理之差的槪率 。 

如果处理有不同的效应，一切可能随机处理施用的考虑证明 
样本处理差是总体处理差的无偏估计，样本处理差的总体也有一 
个可由样本得到无偏估计的方差， 

参考文献 

in the Philosophy of Science^ edited bj Vincent 
Teous* N*w Yorkt Tlw Liberal Arts Pr^ss. 

习 题 

1. 验证表 26.1 中诸值， 

2. 当 r 1 = 2.0 和 rpS *0,如在§26.4，证明 T , 的全体可能值的 
平均是 H 

3. 在 §26,4中，验证4 = 5,08,和 从而验证 
可估计为2,29, 

4. 设计并进行一个涉及随机施用两神处现的简单实验。恬计处理差， 

然后估计你的估计的方差，例如阼可能要研究汽车吨积增加 a 的效应，不同 
饮食对减轻体透的效应，不同洗涤剂去污能力的效座。 

5. —汽车俱乐部设计一个小实验来比较两种不间牌号汽油所行驶的哩. 
H 随机地 ■指定牌号 A 用于五辆汽军中的两辆，并用牌 . pj.b 于其他三辆 & 在 
实验中，五辆汽车中每一辆所行驶的哩程记录如下表^对假设 t 两神牌号汽 
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22 ^ 

20+7 


24.2 

2&.1 

23-6 


油所行驶的哩程并无差别，计箅观察显著水平，可按照 S 2&. S 中的程序* 
e . 一门课程有六个班， 随机地 选取三个班，在这些班中教师在每堂课 
的终了给以一+小测验。在另外三个班不给小测验 s 在课程终了以后，全体 
六个班的学生部参加一十同样的考试。对这两种教学方法的平均考试分数如 
下， 


有小糊验 



小濶睑 

78,9 

抑 ,i 

n.A 


对两种教学方 法无差 异这个假设，计算观察显著水平。 

7 + —个啡咖俱乐部的两个成员卷入一次关 于咖啡 杯形状的争论。 — A 
说杯口向外拥的杯子比正®往形的杯子更易散失热童 & 他们设计一个小实验 
来比较这两种形状。热咖啡倒入五个杯子，两个杯口外翻，三个不外翮 # 他 
们度 a 10分钟时间飮夹的热量（下、结果是 


杯口外翻 


< 口不夕卜蝴 



估计这两个杯子总体的热置散失差，并诂计这一估计的方差，对无差异的值 
设，计箅观察显著水平。 
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演讲27 


方差分析 

h 

■ 

27.1 在1923年费希尔 [1] 发表 了方差分析，恰好在他用方 
塞这个词来描述标准差的平方 [2] 五年之后。虽然费希尔被认为 
是方差分析的创始人，某些思想确然出现在他之前。 StigUr [3] 
提醒我们注意早在年 Edgeworth 进行了很象方差分析的 
计算。自1923年起，方差分析变成一种非常有用的统计分析<可 
能比任何其姐方法做得都多）。 数不 清的书 和文章写着方差分析 
的某一个方面，并有几乎每一种数学水平上的理论 描述。 在本讲 
中，我们将在介绍性的水平上用很少的数学对方差分析的本质作 
一些 深入的 解释。然而~些算术计算却是不 可避 免的。 

a" 

a t 方差分析，事实上，并不是真正研究方差，而适研究变 
异。 作为一个精 炼而： ffl ： 观的叙述，我们赞成 Snedecor [4] 的讲法 
“它是从可比组的数据中分解出可追溯到某些指定来源的变异的 
—种技巧。 # 这一简单叙述使我们很淸楚地理解我们在做什么，并 
是一盏明灯使我们在计算的细节中不会迷失方向/ 

一旦我们决定试行按指定变异来源 来分解 我们数据中的变 
异 ，我们 必须决定如何 去度置 变异。事实上，已经证明对此有用的 
度最 变异的唯一方法是样本均数偏差平 方和， 于是，方差分析是关 
于把数 据中的 全变异 （用样本均数偏差平方和 度量〉 分解为 可追溯 
到 指定来 两的部 份变异 (也用平方和来度 董〉。 

27,3作为方差分析的第一个例子，我们回到23讲的例子。 
第-次考试分数（ X )是用来描述最后考试分数的。预测最后 
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考试分数 (兮） 是用最小二乘方线预测出的最后考试分数，数据摘 
录于表 27 . 1 中。 

表 27 + 1 田归的例于 


X 

Y 


59 

6a 

69.9749 

6& 

TS 

71*05ftl 

n 

70 

74.8493 

n 

7ft 

75* 3m 

i 

n 

81 

79 mi 

SB 

■ 

78 

61-8301 

se 

69 

82.4317 

93 

8* 

46.2229 

总和 sir 

€21 

fZl^OUOO 


按照 Sn ^ iecor 讲法的精神，我们希望把可追搠到特殊原因 

的变异分解出来，我们已经算_出样本均数的偏差平方和是 

S<Y^Y) l = 341,8750 

什么是这一变异可能的一些来 -? 显然， Y 所以有变异的一 

个原因是後性趋势。我 f 来计算诸^值样本均数的偏差平方和 * 

5JY tj = 48, 437*1529 

2^ * 2 Y t = 621 

所以 

437*1529 - 4&， 205*125 
= 232,0279 

其他来海或变异原因是所有的 Y 值并不都位于回归线上，我 
们用:度量这一变异，其中 d 代表观察值 Y 偏离预测值 f 的偏 
差，即 d = Y 1 和= S ( Y - 兮)％在 2：] 讲中我们算过 

= 109*3471 

我们并没有见到其他的变异来源，并且我们注意薄 

341.3750^ 232*0279 + 109,8471 


即 
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总 55 =固归 SS + ® 余 SS 

其中 SS 代表样本均数的偏差平方和^我们惯常把这些结果（连同 
即将讲解的一些其他量) i 3 录在表 27.2 —样的一张表上，请注意 
AOV 表示方差分析。 



*27.2 

回 ㈡ AOV 



来源 

jf 

SS 

MS 


总 

7 

341*3700 



回 B 

1 

232.0279 

232 + 0279 


剩余 

6 

109-S471 

1S.307E 



标着来源和 SS 的两列应是清楚的，然而标着 df 和 MS 的两列 
却要求作些解释。简写为 df 的自由度在初起时是难以解释的，并 
且这一名称看来也奇怪。名称和意义都与工程和物理中的应用有 
关。初学苕最好先接受这个概念和术语。符号 MS 意味着平方和 
的平均 ，这一列中的数字就是以自由度去除相浐的平方和 

平方和的平均列的一个明显的应用（在某些给定的假定下）是 
对回归系数为零的假设进行 F 检验。 

F = 回归 MS/W 余 MS 
= 232*0279/13,3078 = 12.6737 

由表 A.7, 我们见到分子的自由度为 K 分母的自由度为6的 F 取 
这么大的值的概率约0*01，即 

51^ = ?(尹>观察到的 F )=0*01 
因此，我们坚定地认为 

27*4 对那些较熟悉代数的读者，表27,2中总平方和的分解 
可以简单地用下列代数恒等式来解释， 

=回归 SS + 剩余 SS 
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27,5 作为方差分析的 下一个 例子， 考 虑分为若干组 [ 比如， 
(1) 几个不同城市的家庭收入，（2> 不同图书馆读者的年蛉， （3) 
大学不同年级中学生的智 力商数]。不 问于上个例子，这里没有回 
归线，而可能辨认出的变#来源仅仅是组间和组内的变异。为了 
使计算简单，考虑另一个简单例子，假定在一个茜养实验屮，12个 
动物中每4个接受三种可能食品中的一种，它们体重的増加是表 
27,3中的数据。 

裹 27.3 营养实骁 



? < t - fy 



( Y-yy 



24 

27 

9 

24 

2B 

25 

25 

27.75 

7.S62S 


30 

27 

9 

26 

29 

9 

30 

27 + 7S 



26 

27 

I 

32 

29 

9 

27 

2T-75 



2« 

27 

I 

34 

29 

25 

29 

27.7S 

1.5625 

总 m 

103 


20 

1IG 


68 

111 


14,75 

均数 

21 



39 



27 + 75 




表 27.3 屮的 Y 表示体重的增加，而其他各列 I 1 ;类似于回归例子那 
样作出的。对食品 A , 样本均數 2 ?取作预搠他 V ，29作食 a B 
的 V ， 27.75 作食品 C 的 Y 。 这时， （ Y - f ) s 列就很自然地得出 
了 1 对这一例子， 

S ( Y - Y ) 2 = SY a -( SY ) Vl 2 

= 9463 - 9352.0833 
= 110.9167 

采用回归例子中同样的符号 

-Yy = 9352,0833 

^4(27)^ + 4(29) 2 + 4(27,75)^9352*0833 
= 3*1667 

于是剩余 SS = U - 兮 > 2 = 20 + 6 S + 14,75 

=102,75 
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集合这些量于一个方差分析表中便得衷 27.4. 


*27.4 一种方式分组 AOV 


来海 

di 

SS 

MS 


总 

11 

110+9167 



组内 

2 

8.1667 

4,033t 


组间 

9 

102.7500 

11^167 



自由度可求得如下，总的自由度是观察个数少1，组间的自由 
度是组数少1，而组内的自由度通过减法求得。另一方法求组内的 
自由度就是把每一组的自由度加起来，即3 + 3 +3， 

检验食品总体均数相等的 F 检验只不过是 

p MS 间 

4.0834 

" 11.4167 _<1 

由表 A *7, 我们见到这么大的一个 F ， 其概率极其大，因此等均 
数的假设是非常可接受的， 


Z 7 . B 刚给出的单 一方式 分组的方差分析可以简单地用一个 
代数恒等式来描述6在 t 个组中第 i 个有^个观察，总共 t 个组 
有 n 个观察令 t 代表第 i 组中第 j 个观察，代表 

第 i 组的均数，以 M 代表全体的均数，于是 

M) 1 M,)* 

U J i.i 

27.7 我们引入了 方盖分 析作为把全变异分解为来源可辨认 

的变异 的一种技术。 所 举的例 子只包 括筒单线性回 归和单一方式 
分组，因此只有 三种变异来源 0 显然，仅在变 异更多的时候才能体 

会它的功效 * 然而更复杂情况的思想是与本讲中所说的思想相似 
的。 
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27 .S 费希尔在他的 ^Statistical Methods for R-isearek 
Workers —书中给出方差分析。然而他所给出的表是为 Z 不是为 
F, 这要求取平均平方和之比的自然对数再折半。按 F = 编出的 
表就可避兔烦琐的计箅。虽然 F 表是 Mahalanobis 第一次在1932 
年所编出， F 却广泛被称为 Snedecor 的 F, F 表出现于 D34 年 
出版的 Snedecor 的书[ 4 ]中， Snedecor 简朴地说表是从费亦尔的 
Z 表算出的，尽管 F 优于 Z , 费希尔在他后几版的汾 a 山山 d 
Methods for Research Workers 书中继续印他的 Z 表， 

小结方塞分析 ，第一次为费希尔在1扣3年所 给出， 是用得 

最 频繁的统计分 析之一 ，基本说来，分析的不是方差而是用偏离样 

本均数的 ffi 差的平方和所度量的 变异。 这一平方和称为 总平方 

和， 分解为若干部分，每一部分用追溯到一种来源可辨认的变异。 

对于简单线性回归，总平方和分解为两项 t 由于回归的平方和 

以及由于傰离回归直线的剩余平方和，剩余 SS 坷以写成剩余 SS 
= ( 总 SS){1 - r 1 ), 

对于单一方式分组的数据，总 SS 分槨为组间 SS 和组内 SS。 
每一个平方 狗有一 定的自由度而一个平均平方就足平方和被 
它的自由度除。人们用 F 统计量来检验组的均数相等， F 统计量是 
组间平均平方与组内平均平方之比。 

丨参考文献 
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习 题 


1 + 验证表 27. 2中的方差分析。 

2+验证表 27.4 中的方差分析。 

3. 证明 527.6 中的恒 等式。 

4. 对以讲中习题1的数据，怍一象表 27.2 的方差分析表。用 F 统汁 
董， i 十 WHv 氏=0对 H 1 :方的显著水平 4 

5. 对23讲中习跸2的数据，重复习题4。 

—儿童心理学科研人员设计一十实验要求儿童在 fi 到银幕上闪出一 
幅图象时按下揿纽。对4个年龄组的儿童，他喫 fi 反应时间（秒)。 



HEHHI 

HDHH 


40 

37 

34 

32 

42 

36 

31 

2S 

3ft 

35 

33 

27 

4S 

42 

38 

33 

4! 

4ft 

37 

29 


对这些数据作一类似于表27 + 4的方差分析，用 F 统计董，计算检验四个年 
龄组反应时间相等的显奢水平。 

7+大学教学人员响应一次薪金调査，说出他们的职称 r 薪金，以及评 
定职称圬的年数，下面给出评定职称后的年数 X 和年薪 Y < 单位千美元、 


X 

Y 

X 

Y 

5 

25.5 

zo 

43.1 

10 

27*5 

13 

23.1 

8 

20-3 

ie 

33.4 

15 

32.5 

3 

27 .a 


站， 3 

2 

23.1 


如在表 27 J , 计算方差分析和 F 统计置^对囡归系数为零的假设，什么是 
显著水平？ 


8 . 下表列出全国主妇所报告的在不同海拔上煮热青豆的时间，计算方 
差分析和 F 统计置，对海拔不影响煮熟时间的假设，计箅其显著水平，令 
X 二海抜(千呎>,¥ =煮熟时间（分 
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3. —社会科学家为了研究人们对宗软问蛵的态度，对大学生发了一张 
调查表。每-学生按1到5的打分回答50十问题，髙分是一个较保守的响 
应。于是对毎 一# 生记录下他对50个 H 题的平均响应，学生分成3组*无 
宗敉训练的，有一些宗教识练的，和很多宗教训练的，作方差分析*计算 F 
统计置和对组平均无差异的假设的 H 著水平 a 


无 一些 很多 



2 ^ 

a *3 



2.4 
1 + S 
2 + 2 
1.9 

2.4 
2.7 



10. —中学毕业班在第25次返校团聚时，参加者各填写一张调查表说 
出他们的年薪和所获得的最 k 大学学位。有两张表因为太; R ： 丢弃不箅，其余 
的单子给出下列统计 


HT 1 


S 


理学士 
文硕士 
哲学博士 


6S 

17,251> 

2,125 

13 

21_125 

3,275 


26,340 

2,960 



作方塋分折，计算 F 统计 s 并计算三组的平均工资相同假设的显著水平* 


• 23 S 


■« 







一 些随机化实验 






演讲28 


实验设计的概念 

28.1 实验科学领域感谢费希尔在罗瑟姆斯坦特的创新工作。 
可以十分肯定，实验科学并非由费希尔开始，而实验设计，如我们 
现在的用法，确实起始于费希尔。他的文章 [3] 开拓了他的重要著 
作 Design of 家咖 [4] 的道路。著作中所斑含着的 

思想广泛地为 Site decor 的 Statistical 和 Cochran 

and Cox 的 [1] 的书所传播 Kempthorne [：5] 和 Cox [2] 的著名 
的书是较高一级水平的。 

28.2 从 某个方 面说来 ，实 验设计这个词 有歧义 我们既不涉 
及实验室设备的设计或实验室动物如鼠或鸟群体的饲养，也不直 
接涉及度量实验响应的仪衷的设计。相反，我们关心的是收集和 
分析数据的逻辑。所谓实验设计是指产生数据的计划，使数据的 
分析可以使用有坚强理论依据、经过他人检验和试用过的方法。 


28.3 还应强爾，本讲只涉及某一种类型的实验- 种比较 

型实验，不娃一种绝对迓实验。一个绝对型实验是去确定一物理 
常数的绝对值，或某一现象的绝对存在或不存在在另一方面， 
一个比较型实验屉去比较几个常数的相对值，关心的是它们之间 
的差 或比。 例如，无线电对人类卢音的一次成功的传输已经足够 
绝对地证明无线电节 H 强可能的。在另一方面，做了许多比较型 
实验是为了达到今日发射机和接受机的设计。 


28.4 接下来我们介绍一种描述比较性实验的方法 0 虽然它 
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并不适合于所存的情况，却能描述其中的大多数井被证明十分有 
用。它甚至能称为一个比较性实验的典范形式。我们考虑这样一 
种情况，在其中施 诏刺 激因素 于某种 实验材 料使产生一个可度量 
的响应。刺激因素称为独理，这只是一属性名称，而实验材料组织 
成为单元，称为实验单元^我们将更多地说到实验单元的定义。 
响应的度量给出观察，然后对之进行分析。 ia 后，实验人员必须对 
统计分析作出解释。图 28.1 图示这些思想。虽然设计一个实验 



1^] 28.1 设计一个实骀 

时要经常想着分析，设计的决定是看实验材料是如何组织的并看 

处理如何施用于实验材料的 U 

28.5 科学是经过意外事故、未能预见的结果，和偶然的观察 
这样一条长枝的道路而来的。然而，一个实验的设计和分析决不 
能完全建立在以前不知道的和没有试过的临时性方法上。一个实 
验的分析一般是依据观察的数学捵扭，数学模型与设计有关，也 
为设计所验证。在随机化一讲 (2 W 中，我们强调随机化的实际行 
动使得考虑处理的不同施 S 的概念性总体合法化。甚至可以说随 

机 ft 是对观察引入概率模型的一个步骤。这一点为费希尔所洞察， 
因此必须认为是一个拫本上的贡献。 

应用正态分布的概率模型常被引入到分析中去。随机化和正 

态分布着的观察之间有什么联系从未明确地定义过，但在大量的 
实践基础上，看来联系是有依据的* 

在 §23. 3 中，我们简短地提到比较性实验比绝对性实验 
需要更多的观察。它比多几个观察要求更多。对若干个实验单元， 
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我 ff 』 必须有若干次处理的独立随机化 /这些 独立随机化称为实施 
( replication ). 为了说明实施的思想，考虑设计一个实验以比较 
三种不同的植物生长激素对种在温室内青豆株的效应。对每一株 
植物随机地施用 A , B , 和 C 三种处理中的一种，这样的实验足 
不能置信的， A ， B , 和 C 的相对功绩是受控于它们被指定施 m 
于植物的相对功绩 & 在另一方面，如果三种处理随机地施用于许 
多植物，我们觉得植物间的差 异会* 平均掉 '而 A ， B ， 和 C 的相 
对功绩会呈现出来。 

许多个观察并不一定意味着许多次实施。假定温室中的植樹 
置放在 三张康 子上，处理是随机地分配于三张桌子，在指定的一张 
谋子上的植物全体都接受一种处理。虽然这样将得到许多个观察, 
却只是一个实施，并且它同一个包含三种植物的实验处于同样状 
态。就 A , B ， 和 C 的比较而言，它只给出三个数宇，三张桌子上 
的全体 响应。 

28*7 多种处理的比较最后变成二种处理的比较，因此让我们 
只考虑比较两种处理的问题。我们将从我们的数据计算出两神处 
理效应差异的估计，记作4。这一估计将会有误差，即 

^ t + e 

或者说，估计= 真效应+实验 误差。实验误荖包含些什么？換一 
种说法，什么因尜使得我们的估计不是真效应而是其他什么？下 
列几点对试图回答这一问题足很有用的。 

U 实验单元的差异。 

2_施用烛理时的误差 # 

S - 度量响应时的误差。 

4* 不知道的因素* 

5. 因素是知道的，但被忽视了。 

所有这些因素影响了实验误差 & 

在判断我们 估计〗 的显著性时，我们需要怙计我们实验误盖的 
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方差 （简称 实验*差方*看来几乎毋需解释实验误差方差的任 
一估计应首先包括产生实验误差的全体因素。例如，在把处理 
随机指定给桌子的温室实验中，实验误差方差不能从一张桌子上 
植物的差异中估计出来，因为这些差异并不包含枭子间的差异。 

28.8 在设计实验时常有这种情况，我们预想从数据中可能 
会有怎样的方差分析。这确是如此，因为经常对设计实验的数据 
作方差分析 c 有些作家常常就称方差分析或它所依据的模型为设 
计*然而我们却保留设计这个词用作描述指定处理于实验材料的 
方案， 


小结实验设计的思 想裉多 来自费希尔的工作，在比较性实 

验中，目的是比较两种或多种称为处理的剌激因素。施用处理于 
实驗材料单元，其结果为响应和观察。然后分析观察并对分析作 
出解释。实验设计主要关心于组织实验材料和处理的指定。 

数据的分析会得到处理效应 T 的一个估计纟，但估计含有误差。 
很大一部分精力是关亍估计这一实验误差的方差。实施 <即处埋 
的独立 重复) 有减少实验误差方差的效果 • 同时，它使估计实验误 
差方整成为坷能， 
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演 i 井 29 

两组实验和成对实验 

\ 

29.1 1954年美国举行一次大规模群众性实验以确定背髓灰 
质炎茴苗的效果。 M e ier [2] 给出一个良好叙述说明统计在介髓 
灰质炎菌苗现扬试验中所扮演的角色。这些涉及一百万儿宽直接 
总费 m 高达五百万美元的试验需要按照高明的实验设计原则制定 
计划。这次研究的一部分足作为一次两组设计來计划的，约有二 
十万儿齑接种脊髓灰质炎茼亩；另外二十万儿童接种一种对照液 
(一种 在外表上很象脊髓灰质炎菌苗的“糖水” h 这两组的小儿麻 
痹症的感染率是明显地不间。接种的有82人感染小儿麻痹 症; 而接 
种对照液的有162 ^人感染此症 & 菌苗的有效性的这一证明导致它 
的普遍应甩。 

Pfeiffer [3, 页卟]描述了一个小得多的两组实验。从亚里 

士多德的时代起，科学家们曾认为当一些物质腐烂了的时候会产 
生某种形式的生命。16抑年 Francesco Redi 对这一想法提出挑 

战。 Redi 把肉放在网个瓶内，一个有盖，另一个没苻盖，荆个瓶中 
的肉腐化，但只有没有盅的那个瓶生产了苍蝇 。 这一实验否定了 
腐烂物质会自发地产生生命的想法。 

我们现在要详细描述两组实验和成对实验。为了减少计算， 
我们将考虑小型的 实验。 

你将怎样设计 …个 实验以比较两种治头痛药的效果？两种药 
品 A 和 B 的制造商都登广告宣称他们的药优于另一种> 我们仅对 
效果的一个方面 一- 止痛所耑要的时间——感兴趣。假定你的统 
计课中全体卽个学虫自原#加不论你怎样设计的实验。 

在这一情况中，主要困难之一.如何感到止痛的时间，因 
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为对一个人能解除痈苦的东西并不一定能对另一人也解除娴苦。 
并且人们足在不同的痛阔感到需要服川止痛的头痛药。在研究了 
痛的问题并査阅了有关类似实验的文献以后，你决定进行如下。 
当一个 ft 愿参加实验的人经历一次头痛，在痛变得厉害时，服 .『 n 指 
定的止痛药，并记下回到舒适时所需的时间。 

23*2 在想出了度量感到止痛的时间之后，你现在就要决定用 
哪一种随机化设计：一个两组设计还乜一个成对的设计。两组设 
计包括从20个自愿参加实验的人中随机地选择几个服用止痛药 
A ， 其余的服 ffl 止痛药 B ， 一般说来，我们将选10人闬 A ，10人 
用 B 。 成对的设计要求把受试荇匹配成10对使得每对中的成员 
尽可能一样，然 G ， 在甸对中 KI 机地指定一个成员用 A ， 另一成员 
用 B 。 如果匹配有良好基础的话，这样做的想法是在锊一对屮我 
们可以有 A 和 B 的一个很精确的比较，并且我们还可把这搜精确 
比较中全部10个组合起讳 U 在另一方面，如杲看来没有^配的連 
础，很可能选用两组设计，因为它简单。在所讨论的朽题屮，在你 
能把你的自愿参加者理”地匹配成对以前，你可能需要大量的信 
息关于他们对痛的反应。我们将继续这一讲以完成正在讨论的两 
神 设计。 . 

H 3 如果你决定采用两组设计，并且你这样做了，在你未取 
得观察以前，你已经知道你将怎样去分析致据。数据可 m 随机化 
—讲中所讲的计箅来分析。较普通的楚, A 和 B 观察代裴来自两个 
正态总体的两个随机样本，分析将以此为依据 U 分析的 H 的足要 
对这些总体的均数和方差提出意见。在下面我们将说明丧29,1中 
数据的分祈，假定两个总体的方差是相等的，并假定我们要比较均 
数。 

列 A 和列 B 给出止痛时间 0 这些数宇的平方给出在列人 2 和 
列1^中。在做出苏他计算之前，请 注意药 A 和药 B 的平均止仙时 

• 247 - 




*29.1 A 和 B 的止痛时间 < 分）两组实验的数据 



35 

625 

32 

1024 


16 

356 

4 ， 

1936 


20 

400 


2116 


30 

900 

28 

784 


46 

2116 

36 

1296 


22 

4«4 

4$ 

23Q4 


典 3 

6ftB9 

53 

2809 


Z6 

676 

76 

5776 


34 

1156 

58 

3364 


ZS 

676 

42 

1764 

总数 

m 

14*178 

iG3 

23,173 

均数 

32.& 


46,3 



间。药 A 的止痛时间平均快了 I 3 . S 分，因此人们可能合理地问为 
什么还要作进一步的计算？是不是很明显实验证明了 A 比 B 好？ 
但等一等！在那些用药 A 的人中和在那些用药 B 的人中，有相差 
大于 〗 3,5的。正确的途径是，当我们考虑实验单元被同等处理时 
的差异，试图判断均数间有133的差异是否显著。换句话说，我们 
感兴趣的是，即使 A 和 B 的总体均数相等的话，那么凭机会出现 

这样大的差异，其概率是多少呢？要求这一概率，我们将估计 
均数之差的标准差并计算一个 t 值。 + 

S = 32*8 B 46 *3 

<^)710-10,758*4 (2B)V10 = 21,436.9 

= SA a - ( SA)VlO 

= 14 , 17 ^- 10 , 758*4 

*=3,419.6 

2(B- S” = SB 2 - (2B> 2 /10 

= 23,173*21,436,9 
= 1 , 736.1 
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假定两个总体有同样的方差，用两个样本的变异来估计共同 

的方差看来是合理的。这一估计是把偏离样本均数的偏差的平方 

和汇总〈或加〉 起来并除以汇总< 或加〉 起来的自由度而得出 

£ 汇总的 ss 
s - r 总的 df 

3,419,6 + 1,736,1 

S - - : . . . . . 

9 + 9 

= 286*4278 

样本均数的方差是用 sVn A 和 sVim 來估计的。因为均数之差 
(以及和）的方差是方差的和，均数之差 S-3 的方差可估计为 

S fc 2-B = S a ( 1/llA + 1 /ab) 

= (286.4278)-(1/10 + 1/10) 

= 57 , 2856 . 

这时 S-B 的标准差只是诂计方差的平方根，这就是 

sa-S = 57 * 2$56 

= 7.57 

最后，检验无处理差异的假设 邱 = 0相对于有处理差异 
的备择假设 H A :如 卞抑的 t 就是 

, S—B-o 

% ^3 --- 

SA-B 

= -13.5/7.57 
= -1,78 

$果假设的差异不是零而是另外一个数，比如说1那么从 

A - E 中减去的不是零而是夂这一 M 著性检脸的最后一步是计 

算一个 t 大于或等于这个值(绝对值）的概率，这一槪率或显著水 
平 SL 为 


SL = P(|t|>l,78> 

从表 A.5 查得它大约0 + 10。因此，如果总体均数相等的话， 13.5 

的差数似乎略为不大可能，但如我们可能臆测的也非使人支持均 
* 
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数不等不可的情況。 

我们可以描绘 SL 值对各个假设值的曲线以获得对 
总体均数差合乎事理的值有一较全面的图象。从这一曲线我们发 
现所有介乎_ 

S-S-2.10lsi_s 和 A-B + 2,101 sI^b 
或 . 

- 29,4 和 2*4 

的心-知值将产生一个 SL 值大于0.05。这时我们可以说所有 
这些值在 0.95 水平上与数据相协调。 Kempthome 和 FolksEU 
称这样一个 E 间为协调区间 。 这里的 2.101 只婭 t 表上的一个 
值，它表示在自由度为 1S 时绝对值大于它的概率为 CK05。 

29.4 接下来我们要讲解应用一个成对的设计的分析。我们 
不准备对每一步给出同样多的讨论。显著性裣验的思想是一样 
的：我们计算一个 t 值，然后确定绝对值比它大的概率。表 29*2 给 
出从列 A 和列 B 可能获得的结果。 


* 29,2成对的实验的数据 


请记住做一个成对的实验的一个理由是取得每一对内处理 
的一个精确的比较。于是第一步是对每一对得出止痛时间之差。 
在例子中我们算出 D = B - A。 事实上我们也可对每一对计箅 
A-B。 我们做哪一种都不成问题，只要对全体的对做同一种。现 
在用作进一步分析的模型是10个差 （D ) 构成‘自均数为 /V = 


Mb 和方差为 crx /的 正态总体的一个随机样本。我们要对 
H 0 ： ^=0相对于 H a : ^0 作一个显著性检验。 

方差仍^用 51> 2 ::^①-⑴^/^-”来估计^其中 n 是成对 
的对数。这时 

StD'D)^(SD)VlO 

= 606 -384.4 


因此 

H 

和 

D 的方差估计为 

从而有 

于是 t 值给出为 


= 221 + 6 

Si> 2 = 221 • 6/9 
= 24.6222 


sr > = 4^96 


Sp a = Sr//n 


= 2.4622 


Sd ^* 4622 
= 1.5691 



D -0 

SD 


6,2 

口 1*5691 


= 3.95 K 
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(对 H 0 ：^> = c f 我们要减去 c 。） 由表 A ，5 用 9 df 求出 

SL = P (| t |> a .951) = 0. 01 

一 个百分之九十五的协调区间给出为 

D±2.262s5 

或 6,2土 3. 55 

或 2*65 和 9.75. 

因此，介乎 2*65 和 9. 邛间的值将给出大于 0*05 的显著水平 t 


两 组实验的一个突出的例子由 Wafcemaii 和 Kaplaff 
[5] 所做的一个实验的某一部分提供的数据 所给出 。 烧伤病人被 
指定于两组中的 一组： 一组只 用药物 治疗，另一组是在催 眠下的 
药物治疗。 对每一病人 i 己下所允许的药物治疗的百分数 & 对四个 
接受催眠的病人，平均百分数为 40, 对五个只接受药物治疗的病 
人，平均百分数为 80, 因此接受催眠的病人要求药物治疗的水平 
低得很多。 

29-6 Sackeim , Gur ， 和 SaucyM 报告了一个有趣的成对 
实验的结果。把呈现不同情感表情的一些人脸图形从中剖分为左 
右两边，并 作出左 边和右边的合成图。右边合成图是把原来脸象 
的右边和这半边在镜子中的映象作为左边组成的。同样，左边合 
成图是一个对称的脸象，其右边是原来脸象的左边在镜子中的映 
象。然后把左边和右边合成图作成的幻灯片显示给受实验者，并 
要求他们把表情的强度按1〜7打分。这一实验的结论是 * 人们的 
情感更强烈地表示在脸的左边， 


小结两种最简单的 实验设 计是成对的设计和两组设计^成 
对的设计随机地指定两种处理于一对实验单元内的实验单元。如 
果有 n 对，就有 n 个独立的随机 指定。 两组设计指定一种处理于某 
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些随机选择出来的实验单元而将另一种处理施用于其余的实验单 
元。 因此，对一个两组实验只有一个眩机指定。 

成对的实验的结果给出一对观察，并且分析是对11个 差数进 
行的。分析 m 的樓型是 n 个差数来自一个单一正态分布的一个随 
机样本。 

两组实验的结果给出两个样本的观察，分析用的模型常常 

是来自同方差但均数可能不同的两个正态总体的独立的随机样 
本。 


本讲给出两种类型实验的几个例子 

参考文献 

I. Kempthorne, O* and L. Folks (1971) Probability, Statistics, and Data 
Analysis, Ames ： Iowa Statt Press. 

2 - Meier^ Paul- (1972) "The Biggost Public Health Experiment Evert TUe 1954 
Field Trial of tte Salt Poliomyelitis Vaccine, ” Statistics，A Guide to the 
Unknown^tdlte6 by Judith M-Tahuiv et San Francisco ： HoHen^Day * 

3+ Pfelffe r > John.(l964)Tfee CeU^ew York ； Time, 

4* Sacteim F H.A., R + C.Gur- and M.C. Sauc，+ { 197S) Emotions Are Expressed 
More Intensely on the Left Side of the Face, n Science t 2d2 t 4J4-436, 

5 . Wakemanj R* John, and Jeroltl Z, Kaplan- ( 197 S) tf Art Experimental Study 
of Hypnosis la Painful Burns* *"The American Journal of Clinical Hypno 

霣 3-i2, 


习 题 

h 验证 §29.3 的讨興:。 

2 . 验证 §29.4 的计算 p 

3* 在初学统讨的学生中，两组数据应看作是成对的还是不成对的，雋 
常引起? R 清。由这一讲中所提出的观点，我们将如何区别？在成对实验和 
两组实验之间， f 彳么 I 随机化中的主_区别？ 

4 . Wakeman 和 Kaplan 在他们的文章中没有给出基本数据，只给 
出平均数。假定九个病人所要求的允许药物治疔的百分数如下， 
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光是药物咨庁 . 催眠及/ 或药 物治厅 



£6 



76 

37 

81 

51 


计算 t 统计量以比较均数，并对原假设6 h 相对子备择假设+妾内计 
算观察显著水平。 

5^ Sackheim ， Gurr ， 和 Saucy 幷未给出原始数据；他们只报告了结 

论。假定我们对一组八个裁判员提出左边和右边合成图各10张。裁判员按 
1 至 7 打分，这时 10 对平均分数如下， 


左边合成图 

右边合成图 

3.375 

3 + &25 

■ 

*-750 

4-875 

5 + 125 

5 + 250 

6.250 

6.125 

3-750 

4 + 125 

4.87S 


£.125 

5 + fi7a 

6.2S0 

6 + 62S 

S + ft75 

G.ZSO 

5 + 250 

6.37S 

* 


计算 t 统计量以比较均数，对检验 =/** 相对于计算观 
察显著水平。 

S . 幼年童子军自造小型车参加一次大竞赛在一次地区性淘汰赛中， 
赛场只有两条车道。童子军们觉得左车道比右车道来得快，因此做了几次 
试赛，使每辆车跑过左、右跑道各一次。用秒表记下时间，其记录如下， 
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计算统计 at 以比较均数，为了检验左=私右相对于扎*哋<卢右，计 


算观察显著水平。 

7,一个十八人蝼味小组，对其中每一个人，随机地提供两決〗:腰部牛 
m . —块在兗调以前贮撖了六个月；另一块是新杀的。小组的每一人按五分 
制打分，其记录如下。 


教过的 

新鲜的 

藏过的 

1 

3 

1 

5 

4 

Z 

5 

S 

2 

1 

& 

i 

i 

1 5 

5 

3 

3 

3 

I 

4 


新蛘的 

藏过的 

新鲜的 

X 

1 

3 

3 

2 

■ 

4 

3 

Z 

1 

Z 

4 

2 

2 

2 

3 

1 

2 

1 

3 


对平均分数间无差异的假设相对于有差异的假设作一检验^用 a ^ O.Oh 
8. —家饭店在考虑两神不同牌号的逋用；^器。他们关心于咖啡杯的保 
溫 & 于是设计了一个两组实验，以比较两种脾号瓷杯失热的情況，实验的 


统计数字是 


n 

X 

SS 

牌号 a 

20 

18 + 2 


睥号 B 

20 

22-3 
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对相对于 H A 4 A =? M 0 进行检验，用 

9. 一个工商管理的科研工作者要研究午餐时鸡味®对办公室工作效率 
的影响，他用了一个两组实验。从一群自哆参加的打字员中随机地选择若 
干人在午餐时给一英两酒，其余的二英两》在午餐后第一个小时内对每一 
个参加的人记下打字速度和错误率。对平均打字速度和平均错误率没有差 
异的假设，计算其观察 ft 著水平 u 


打字速度 
II X SS 


错误率 

S ss 


一英两 12 55 24,122 5.2 76.11 

二英两 li &2 26*30* 7 A 82.33 

10,在一个大的系里，每一教师指定要敎一门低年级的课和一门高年 
级的课。在学期终了，所有课的学生成缋都要进行评定。对每一教师，这 
样就有两个总的评定 & 检验原假设 t 髙年级和低年级课程之间学生的评定成 
统并无差异，用《=0.05。 


^ 1 低 

3-21 

2.93 

3-41 

3-12 

2*as 

2-86 

3 + 35 

2.6S 

3*67 

3+25 

3-2+ 

3*01 

3.13 

2*94 


4 
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演讲 30 

完全随机化设计和随机化区组设计 

3( M 在这一讲中我们要讲解两个很简单 <而用得很多）的设 
计：完全随机化（或完全随机）设计和随机化区组设计。如在上一 
讲中那样，为了使计算简单，我们用少量的人为数据来讲解分析。 
在讨论实验的安排后，我们用例子来说明做方塞分析所需要的计 
算和紧跟着的显著性 F 检坡。 

30*2 如果一个人确实参加过一次科学研究戎背如果他熟悉 
他人的科研工作，他将更容易体会实验设计的需要。对一个从未 
见过或从未参加过一次科研计划的人，演讲 2 S ， 2 9 和30可能看 
来相当独象 4 因此，比较一门统计学的三种不同的教法对学生最 
后分数的影响，可能是很合 适的。 

K 方法 A 。 正规的统计学讲课补充插述现行科研中实际例 
子的现成资料。 

2. 方法与方法 A 相同，再要求学生们设计、收集、和分 
析来自 他们自 己实验的数据。 

3 - 方法 C 。 正规的统计学讲课，并无其他特殊 要求。 

要进行一次这类有意义的实验其困难是巨大的。然而教育科 
学研究人员曾做 7 H 午多这样的实验；例却“新数学”教材和传统教 
材比较的实验。 

我们将假定已物色到12班学生弁得到他们教师的同意参加我 
们的实验。我们正在考虑用一个完全随机化设计还是用一个随机 
化区组 S 计。一个完全随机化设计将包括：指定方法 A 施用于从 
12班中随机拢选的一些班，方法 B 施用于另外一些随机选择的 
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班，方法 C 于余下的班，在另一方丽， 一 个随机化区组设计将包 
括： 把12班分为4个组（区 组〉 并在每一区组内随机指定三种教的 
方法于 H 个班 J 28讲中讲解的术语，教的方法为处理，学生的班 
为实验单元。让我们给出这两种设计的明确描述。 

完全随机化设计。我们有 n 个实验单元和 t 个处理。指定处 
理1施卩于随机选择的^个单元，处理2施甩于随机选择的11 2 个 
单元，余类推。实施数(^， n 2 , + + ■> 可以相等也可以不相等。 

随机化区组设计。我们有 bt 个实验单元分成 b 个区组，每个 
区组 t 个单元和 t 个处理 。在 每一区组内，处理是随机指定于实 
验单元的 P 


30*3 现在假定我们已决定采用一个完全随机化设计，弁假定 
我们已得到12班中每班的平均分数如表 30.1 中标着 A ， B 和 C 
的三列所示6 

表 30.1 完全眨机化实验数据 



73 

^211 

83 

61 

6, 561 

86 

86 

7*396 

91 

77 

5, 929 

81 

总奴 323 

26, 127 

341 


S. ^9 

67 

4. 439 

7* 335 

72 

5, 184 

S*2R1 

74 

S, 476 

7, 05C 

GS 

i r G24 

£9, 622 

2S1 

19,773 


作为下面分析所用的棋型，我们将把 L : 种方法的数据 w 作来自均 
数为叫、抑、价，公共方差 a 2 的三个不同正态总体的三个随机 
样本。表加.2中的方差分析与 28 讲中所讲的」种方式分组一样, 
虽然我们将用略为不同的方式以得出平方和， 

修正因子 ( CF > 为（总和〉 Viu 即 

CP= (948)712 = 74892. 

总的平方和是由每一观察的平方和减去修正因子而得到的。组问 
和组内的平方和如下： 


* 


258 • 




总的 SS = 75, 532-74,892 


组间 SS- 




= 630 

(323^ s <34h 2 (281) s 

-h — 1 -- 十 

4 4 4 

75,406.5-74,892 



= 514.5 

组内 SS = 总的 SS - 组间 SS 

= 115.5 

由于组间平方和锆组间不同的处理产生的，我们将捭之为处理平 
方和。我们称组内平方和为误差平方和，因为组内平方和足实验 
误差方差的一个估计，这个估计已在 2 S 讲中讲了。 

表30 .2 完全随机化设计的方差分析 
來原 df SS MS F 


总 

11 

630 



处理 

2 

514,5 

257,250 

20.016 

误差 


115.5 

12.833 



为了检验处理效应之间没有堃异的假设，我们 m F 比 

F 处理 MS 
一 误差 MS 
= 20.045 

接下来我们计算有一个更大 F 值的槪率。査表 A.7， 取分子自 

由度2,分母自由度9,我们有 

SL = P(F>20*046) 

丰 0*001 

把 ffi 著水 平看作对同等处理效应假设的一 个可信指数， 我们很可 
能会总结说处理效应不同 6 事 实上，处理 B 的样本均数是三数中 
最大的，所以我们倾向于以方法 B 为讲授统计学最有效的方法 * 


30.4 如果事实上我们有理由把实验单元(在即将讨论例子中 
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的班合起来成为区组，我们应诙考虑这样做并应用一个随机化 S 
组设计。例如，我 a 可能夯这样的情况：12个班由四位教师任教， 
每人教三个班，这样把班合成 H 个 E 组，每个区组三个班，并且在 
每一区组内，我们可以对班随机地指定处理，每一班的平均分数 
可能如表 & 30, 3 o 

表 SO 3 随机化 E 组设计的数据 


处 m 


区组 

A 

A £ 

£ 

B 2 

c 

C 1 

总和 

1 

74 

5, 476 

79 

6 f 2U 

63 

9 抑 

m 

2 

7ft 

5,776 

sa 

6,883 

75 

&h 625 

m 

3 

Si 

7, 056 

B9 

7,921 

67 

4 卜 489 

240 

4 

79 

6,241 

94 

8 t S36 

76 

5,776 

£49 

总和 

zn 

24,549 

34$ 

29,687 

SSI 

19,859 

939 


在二十年代早期费希尔做出了随机化区组设计的方差分析并 
把它给出在 Stttdent 1923的文章 [3] 的一个脚注中它把总变异 

划分为区钜引起的、处理引起的、和实验误差引起的变异。这些 
平方和可计算如下。 


= 73,476,75 
总的 SS = 74,295 — CF 

= 818,25 


区组 SS = 


<216)\ (234) E . (240)^ 

- 7. ^ — :- - +- 

3 3 3 


(2 扣” 

~3~ 


-CF 


= 73,571 -CF 
= 194.25 


处理 ss = j ^ + i ^ + im、 CF 

4 4 4 

= 73,9 S 8.75 -CF 
= 512,00 
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误差 SS = 总的 SS -区组 SS- 处理 SS 

= 112,00 

我们避免了给出代数公式，希望用例子来介绍计算的方法。方差 
分析的计算有一个特征是，当一个数被平方，它几乎总是被它所包 

含的原始观察个数除。察看一下上面的计算，可见这一情况发生 
了好几次。 

L •> 

最后，我们把我们的计算，包括一个 F 值和一个显著水平排成 
表 3 0, 4 & 因为观察显著水平值很小，我们再一次倾向于感到讲授 
方法确有不同的效果。 

*30 + 4方差分析——随机化区 ia 设计 
来源 df SS MS F SL 


总 

11 

«18.2> 



区组 

3 

194.25 



处理 

2 

512.00 

256-00 

13*71 0.卿 

误差 

6 

m 肩 

lfl *67 



30.5 在以上三讲中，我们指出了统计在实验科学中的功效。 

我们只涉及初级的例子并尽可能避免数学符号，这样只能使学生 
们对实验设 it 略见一斑。 


小结完全讁机化设计和随机化区组设计分别 是把两组设计 

和成对的^计推广到多于两个处理的实验。用完全随机化设计 
时，处 M I 被指定于某些随机选择的单元，处理2被指定于另外一 
些随机选抒的单元，等等9用随机化区组设计时，处理被随机指定 
于每一区组内的单元。在完全随机化设计中，变异是来源于 总的， 
处理， 和误差三个方面，在随机化区组设计中，变异是来源于总 
的，区组，处理，和误夔 四个方面 # 

不论闲哪一种设计，处理的 F 比是 用供差均方差去除处理均 
方差。观察显著水平 是在处理效应没有差异的前 提下， 凭机会得 
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到一个较大的 F 的概率。 
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习 题 

1. 验证表 30.2 中的方差分析和结果的观察显著水平。 

1' 验证表 30. 4中的方差分析和结杲的观 察显普 不平 6 
3 - —个学 生单人 宿舍的指导员关心宿舍宵理政策对学生学业的影响， 
为此进行了一个随机区组实验。在取得24个学生对随机分配宿舍的周愈后， 
将他们分成四个区组，每 组 六人 。分区组是按以前的绩点平均为依据的一圧 
—区组内的学生有相伤的学业成绩。处理是六个 具宥明 显不同规章制度的宿 
舍，在每一区组的学生中，学生们是随机地被分配给这六个宿舍，在年终绩 
点平均如下。 


处理 


3.45 

3 + 63 

2.25 

2.6S 

2+98 

3-35 

2 10 

2.45 

2,93 

3.17 

2.32 

2 + 3G 

Z.2Z 

3 + 52 

2,26 

2^9 

a. 17 


2,47 

2,78 

3-01 

3.76 


2.61 


计算类似于表 30.4 的方差分析表并计算观察显著水平以检验等处理效应的 

假设 & 裉据这些数据，你想宿舍的分 E 影响分数吗？对这一实验的质置你有 
什么卓见？ 

尖 一著名作家与四位不同的人共同编写了四本书 e 感兴趣的是去研 
究这四本书的书写体裁是否明显地不同。一次简短旳研究集中于介词使用 
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的频数 4 从毎本书上选若干段，在二十行的一段内记录下其中的介词敷 

书 


26 



a . 计箅方差分祈和 F 统 i _ Pfi 以检验介识数相等的假设， 

b . 计箅观察显箸水平。 

c . 指明处理和实验单元^ 

S . —个(联营)杂货商在用不同的展出方案来布置软饮料出售部做实 
验。他设讨了一 随机化区组设计以比较三祌不同方案对软饮料一周的销售 
总额(美元)的影响 4 每一方案在每一店铺试验一周*在每一店铺试用的次序 
是随机的， 


店铺 




郎50 

112S 

242 Q 

3A&5 

4213 


8670 
1075 
27 SO 
3 U 二 
3 SC 0 


7675 

1250 

2525 

3«£5 

3S55 


a* 


個设 


计算方羞分析和 f 统计量以检验三种方案窗梠等的平均销售 Si 的 

计箅观察显著水平。 

指明处理和实验单元， 

—个学生-玫员委员会为了调査一些评定学生成绩的興査表格设计 
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—个随机化区组实验 a 还设计了三种不同的评定调 査表格 。在调查表 A 上，陈 
述都是正面措词的。在调 S 表 B 上，陈述部是反面措词的 & 调查表 C 月了一 
些正面的陈述，和一些反面的陈迷，四个不同的大学中每一个苻三个系参加 


这次调査。在每一大学内，表格是随机地分发到系。这里给出系奴师评分 



大 


学 

调査表 

1 

2 

3 

4 

A 

2.65 

2,58 

2-76 

2+76 

B 

2 + 91 

2.74 

2-87 

3,01 


2,72 

2,6! 

2 + 53 

2 S 2 


a. 计箅方差分析和统计 fi F 以检验三种调査表的平均评分相等的假 

ifL 

b . 计算观察显著水平 

c . 指明处理和实验 蹈元。 

7 + —个心理学班的学生自恧参加一次阅读实脸。阎读_张词丧所忠 
要的时间被记录下来。准备了三个类^的词表以至少屯复两次的词的个数 

为区别》词表随机地分发给学生，阎读时间<秒)如表所示。 

■ ■ ■■丨 ■ . . . 

词 表 


12 3 



14.2 

15.2 

10.2 

15.1 

12.9 

11.5 

16,2 

14.3 

15.3 

13,7 

]4」8 

14 6 

13,0 

15.0 

33.1 

12-6 

147 

13.^ 

H-3 

13 + 1 


a. 计算方差分析和 F 统汁置以检验平均阋读时间桕等％假设 Q 

b. 计剪观察显著水平 a 

c . 指明处理和实验边元 ^ 

8. -个大学撖榄球的敦练设计了一个随机化区组实验以比较不同的 

* 264 * 




早餐对球员奔跑速度的影响。早餐有谷类食物，火腿蛋，灼面包和泰饼，薄 

■ 

饼等四种。 E 组包含四 个球员 ，一 个前卫 ，一 个前锋 ，一 个传手，和一个后卫 * 
在早餐后一 小时， 球员作 100 码的短 跑，记下时间 。计 箅方差 分析 ，并检验各种 


早贷对球员的速度并无影响的假设。 



区 



1 


■■m 

IHI 

谷类食物 

9,8 

10-2 

10.1 

10-0 

火閎蛋 

10.2 

J0. 8 

ia.2 

ia.5 

烤面包 和卷饼 

10.0 

10-2 

]0-4 

10-2 

薄讲 

9,7 

10 s 

30 + 2 

ID 


9. 一份大学新闻纸的工作人员正在实验不同的版式，他 们设讣 了一 
个完会随机化实验以比较三种不同的版式 t 对一个新 ra 学班自愿参加的学 
生，每人给以三种版式中的一秤，并在 M 读新闻故事后，给以一个阅读班銷力 
澜验，这就给出下列统计数字。 


版式 

n 

X 

\U\4i ii i i 

s : 

1 

10 

90 

4-37 

2 

n 

86 

3 + 76 

3 

11 

83 

4 + 21 


做方差分析，计算 F 统叶量，并在平均阅遗理解力对全体版式都一样的烺设 
下 ，求观察显箸水平。 
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重要的思想争论 




演讲 31 


贝叶斯学派的争论 

*M Gresham 学脘是皮尔逊讲授概率和统计的池方。在 
它北边半英里处就是 BunhiH Fields。 由小教堂和 John Wesley 
的家附近跨过 City 路，抵达 Btlnhill Fields 这里埋葬了十二万 
人，是不信本(英 国〉 国教的人的著名墓地，自1852年起已不币了。 
John Bimyan, Daniel Defoe* Isaac Watts, Susannah Wesley, 

和许多其他知名人士的墓都在这 SL 这里还有 Richard Price 和 
贝叶斯 （Thomas Bayes) 的墓。 

近年统计学教科书和杂志的读苦们可能查不到费希尔和皮尔 
逊的名字，却可能看见重复提到贝叶斯。初学者可能会樽出结论 
说足贝叶斯而不是皮尔逊创造了近代统计学！其实， 贝叶斯 射统 
计学几乎没有什么贡献。那么,为什么重复提到贝叶斯呢？舂来回 
答是在贝叶斯 [1] 的一篇文章里，这篇文章成为所谓贝叶斯学派统 
计学的思想模式的焦点。这一篇文章发衷于 i7S3 年，是由贝叶斯的 
朋友,著名人寿保险原理的开拓為 Richard Price 在贝叶斯死后 
提出来的。文章含有现在众所周知的贝叶斯定理，它除了把演讲 
名中条件概率法则作了一点精心加工以外，并无什么新东西。为 
了理鮮为什么有这许多注意力放在贝叶斯定理上，很有必要回忆 
一下概率的思想方法， 

3U2 在演讲7中我们讨论了对概率的斛怿，并强调了湛本 
上两神想象概率的方法：（I)作为一个物理系统内在的一种物理特 
性，和 （2) 对某一陈述担信程度的度 g e H ac king [4] 也承认概率的 
这两神主要的设想。从皮尔逊第一次作了一些慨率和统计的演讲 
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时起列 1 950 年代后期止，有压例多敖妁统汁学家來取槪芊的踅一 
种 观点，即一个事件的慨率足该 事件发 生或可能发生的相付频数。 
在这一时期内，贝叶斯定理仅用于概率能在频数框架内鮮释的场 
所9它在 统汴孕 中的应 m 几乎是不存在的。重新思考概率的总义引 
出了泞 ;;1 学中的一大枇文章 ； 在邛中概率坡认为一种相笸程度的 
扠纪。最近贝叶浙学派统计著作的一个浪潮开始于 Lin - 
diey 1970 中的贝叶斯学派统计学文献几乎宵175篇是六十年 
代写的。 

自 I 960 年起，赞成和反对贝叶斯学派统计的两方以皮尔逊 
——费希尔争吵所特有的那种激悄和狂怒在进行申述和争辨。看 
来争点总 A 环绕着如何解释 概率。 我们现在用例子来说明为什么 
这一点在>1叶斯定理的使滔上如此的关键， 


31.3 取统计学中很有旧的一种类型的简单坛子何题 . 有人 

送了我们一个坛子，并知它不足坛子！就是坛子 I & 坛子的内容 
如下。 


坛子4 个红球和 1 个白球。 

坛子 I 。1 个红球和 4 个白球。 

我们从迭给我们的坛子中随机地讪一个球并得到一个 红球。 已知 
我们抽得的适一个红球，问送给我们的坛子是坛子 I 的概率是多 
少?应用演许8中给出的法则，我们可进行如下， 


P ( I | 红） 


P < I 和红 > 

P (红） 

P (红丨 I ) P ( I ) 

mo 


逸时一个红球只能出现于两个互卩的方 式：从 坛子〗和从坛子 I 。 
因此 


p (红） = p ( 1和红） + I 和红〉 

= P (红 U ) P ( 1 )+ P (红 1 I ) P ( i ) 

所以我们最后有 
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p, T ] , T ,_ p ( 红 II)P(I)_ 

、 1 P (江 1 [ ) T ( 1 7+ P (红 I S ) P ( I ) 

^ (4/5>P( I ) 

' (4/5) pT TJTUJs) pTiT 

要得到一个数字答案，我们骷要知道 p ( I )和？（1)，但这 
些并没有在问题的叙述中给出^频数学派的观点是无法进一步去 
计算所霈要的概率。 一 方面，坛子(坛子 I 或坛子 I ) 的状态见完 
全固定的，因为没有随机性，所以无法讨沦 PU >或 P ( I ),另一 
方面，即使我们知道坛子的选择由一随机过程所主宰，但我们并不 
知道与坛子】和坛子 I 相结合的概率，所以也不能进行下去。 

贝叶斯学派的观点可简述如下。概率是我们相信程度的度 
量，我们总能3概率来表示我们相信的程度。完全不知道坛子是 
I 还是 I ，这两裘都可汨概率 1/2 来表示 c 应用这些概率，我们会 
得到 


P ( I lir ) =_ <4/5)( 1/2) _ 

J (4/5)( l /2) + ( l /5) Cl /2) 

-4/5 

另一方面，假定我们强烈辿相信坛子是坛子 S ， 我们可能 Rj P ( I ) 
= 1/10和 P ( I ) = 9/10。那么我们会有 

P ⑴红卜 _ ^/5 KI / iO ) _ 

1 (4/5 M 1/10) + (1/5 X 9/10) 

_ 4 ^ 4 

~4 + 9^ 13 

继续把概率想作相倩程皮的度量 ， 再来苕一下这些计箅。一个红 
球的出现应该增大坛子 I 的概率。上面叫种情况说明了这一点； 
在第一种情况，由 P ( I ) = 1/2到 P ( I 1红> =4/5,而在第二#情 
况，由 P ( I ) = 1/10到 P ( I 1红）= 4/13。 

顾便提一下，用等概率来表示完全不知道的想法是贝叶所在 
他1763年的文章中所用，所以称为贝叶斯公设。它还有其他的名 

称，如拉普拉斯的不充分理由的原则 4 
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31 j 我们现在将用简单坛子例子作为叙述贝叶斯学派统计 
学的基础。我们可以把坛子号数想作一个参数，把抽得的球的颜 
色 m 作 数据。 在我们抽得球并观察它的颜色以前，我们已有参数 
值的概率 [ p ( I >和 p ( i )] & 这概苹称为验（事)前概率，因为它们 
在我们收集数据之前已经存在。在我们收集了数据之后，计箅新概 
率看来是合理的，称这些概率为验后概率，或卑后概率，这些验后 
概率是在已知数据的条件下捉則贝叶斯定理兑出的参数值的条件 
概率 & 

现在考虑基于一个正态总体的样本作出对该总体的均数 p 的 
推断问題。以概率的頻数解释为依据的统计学，把#作为一个固定 
参数来处理，对它,不论在取样之前或之后，是不能作出概率陈述 
的 。对# 的推断将基于"的估计,计箅观察显著水平，协调区间，等 
等*然而贝 叶斯学 派的方法是用^的验前概率和贝叶斯定理以获 
得#的验后概率。 

3 K 5 仍然不淸楚争论将如何进行解决。在1960年以前，几 
乎所有的统计书刊部避免贝叶斯学派方法。费希尔坚持避免使用 
贝卟斯定理，并在他最后的一本书 [3] 中丙一次坚决地拒绝了它， 
虽然皮尔逊 （ Karl ) 偁然用了贝叶斯定理，但总的说来，是避免了 
的。奈曼和皮尔逊 （E.SO 在他们有关假设检验的文章中决定反 
对使用。然而，贝叶斯学派统计学 * 自 I960 年起，吸引了众多的 
迫随者，进一步的发展还会增大它的有用性。 LmtileyCS ] 给出卫 

护贝叶斯学派统计学的一个有力的陈述。反对贝叶斯学派统计学 
的论点，请参阅 Bertson[2] fr 


小结 贝叶斯写了一篇文章，在他死后由他的朋友 Richard 
Price 代为发表。这篇文章,发表于1763年，刊有一个定理，后来 
称为贝 叶斯定理 & 在已知一个条件概率和某些边缘概率的情况下, 
它能界出另一个条件概率。这一定理的有〗 U 性与 概率的解释 有关* 
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如果一个概率，对一个参数 彡， 允许两个可能值 A 和心， 


P 认 I 数据) 


P (数据 H ) P ( A ) 


P (数 + P (数据 I 心） F(M 


为 rpm 这一公式， p ( h ) 和 p ( d 必须为已知。贝叶斯学派把概 
串皙成相倌程度的度2,所以 p <~) 和 p (^) 被看成为在取样之前 
k 相信 程匕的 测度。在取蛀据之后，这咚概率可用计算条件概率 
p <^ m 数 &■) 和 p (匕 I 数据)来修正。这驻修正的概率称为脸后概 

率* 
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演讲32 


费希尔一皮尔逊争论 

32*1 K* 皮尔逊于 1857 年生于伦敦。在他死的 1936 年 之 
前，他写 了不止 M 0 篇文章和许多书，课题由美木史到理论统计。 
应当认为他是现代统计学的创始人。他的儿子皮尔逊对他 
的一生写了一篇概要[4]。其他人写的有关他的文章，见 Walker 
[9 ]， StoufferM, Witks[10] 和 HaldaaeC3] 0 

他与沦敦大学学院发生悠久的关系是从他在 W 郎年进入大 
学学院附属学校开始的 * 在1875年，由于健康的原因，他的父母 
要他退出学校改从伦敦以北30英里 Hiichin 地方的一位私人教 
师学习 # 一年以后他去剑桥大学，按那时的习俗，跟随另一位导师 
学习。1875年他获得剑桥大学 King 、 学院的奖学金，并于 18 W 
年以优异的数学成绩取得学位。 

受了 Ki n 〆 s 学院奖学金的支助，在以后的几年中皮尔逊致 
力于令人难以置信的计划工作，研究和旅行。他去德国学习和写 
作,他在伦敦学习法律，并于1881年取得律师的资格。1884年他 
受伦敦大学学院之聘，任应用数学和力学讲席 * 在以后的几年中， 
他努力对工科学生讲授数学，并对菹围宽广的题材进行演讲和写 
作。 

92 * 2 在伦敦 Gfesham 街和 Basingliall 街的转角处，仍然 
有一所房子挂着一块久经风雨的标着 Gresham 学院的牌子。 T . 
Gresham 爵士〜 1579) 是英格兰的金融家，伊丽莎白皇后枢 
密脘的成员，蛊家交换所的创始人 a 他把100家铺子的租 金收入 
投资于皇家交换所以便建立一所大学使有七位教授讲授“神学、天 
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文、音乐、几何、法律、物理和修辞'由 1579 年到 1768 年，这所大 
学就设在 Gresham 的老家里。这是他采 S 内的一所中古时代的宅 
第*从那时起，课就在皇家交换所里上，直到 1838 年为止. 1842 
年在原地建造了一所新楼 I 现在的大搂，用作伦敦大学城的研究生 
工商业中心，起建于 1913 年。在费希尔出生的 1890 年的 12 月 15 

曰，皮尔逊受聘为 Gresham 学院的第十九任几何讲师。他接受这一 
聘任，同时还保持大学学院的教职直到他于1894年6月12曰辞 
去 Gresham 学院的讲师之联 # 在 Gresham 学院他对概率统计做 
了一系列的普及演讲，这些演讲的讲义附在 E * S + 皮尔逊的书 [5] 
中，统计的现代时期由此开始 6 在1893年的这些演讲中，他首次 
用了标准差这一名称，并开始称槪率的误差定律为正态分布。 

紧跟着 Gresham 学院的演讲以后，皮尔逊在大学学院，1894 
〜 1的5, 1 S 95 〜1896讲授了有关 统计理 论的第一次大学课程。这 
些课程的大纲附在 E + S ■皮尔逊的书[5]中。 

皮尔逊还创姶了 生物统计学， 他在大学学院的实验室经常 
被提到现代去大学学院参观的人已不能找到生物统计实验室的 
痕迹， 虽 然在人类遗传学和生物统计学系内无论是 名义上 还是实 
际上，高尔登实验室还存在。皮尔逊他自已追溯生物统计学实验 
室开始于1的 5 年。和高尔登一起，皮尔逊创办了 •如杂 

志，第一卷出版于1901年。1907年他接管三年前由髙尔登创办 
的高尔登实验室。自1911年高尔登逝 世后， 用高尔登的遗产 
办起了高尔登优生学讲席，皮尔逊宁可放弃他的应用数学讲席而 
接受高尔登讲席，还建立了一个新的系，应用统计系，1912年费希 
尔发表了他的第一篇文章 

1911 年 Herbert H. Bartlett 爵士捐赠一笔钱在 Gower 街 
兴建一所房屋以安顿新的系。1914年房屋竣工，但由于第一次世 
界大故，这所房屋直到1920年才被全部占用。今天大学学院的统 
计学专业仍设在那里。 

在1925年，肋岁的皮尔逊虽已有了光辉灿烂的经历，还发起 
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另一较大的活动，创办 Annah of Eugenics 杂忐以研究人类遗传 

学 。在较 近的年代里，这本杂志的名字已改称为 Annals of Human 
Genetics^ 

在 1933 年，皮尔逊十分不愿地辞去他的教席，并把他的系一 
分为二.费希尔被聘任高尔登讲席并主持优生学系，皮尔逊的儿 
子 E ， S •皮尔 逊被提名担任新的应用统计系的主任。 

皮尔逊继续在他热爱的专业中工作直到1扣6年去世* 

32.3 Kendall [4] 以及 YaUs-Mathed：l 1] 都给费希尔的 
一 生写过传记。 Biometrics 1964 年 6 月份整个一期都是写的费 
希尔 ， E + S * 皮尔逊的文章 [7] 提供费希尔在大学学院的一瞥。 R_ 
A * 费希尔于1890年生于伦敦。在生物统计学和现代统计学正在 
大学学院奠基的年代里，费希尔在 Stanmore Park 学校和 
Harrow 学校受到良好的教育。他 1909 年进入剑挢大学专攻数 
学。他的第一篇科学论文发表于年，同年他毕业于剑桥，而 
三年以后他的一篇关于相关系数 r 的概率分布的著名文章刊登于 
StomeMAd 。 虽然费希尔以后投寄过几篇文章给 Biomehika , 但他 

从未在该杂志刊登过另一篇文章。1別 9 年大学学院邀请他去那里 
任教，但他没有接受而去罗瑟姆斯坦特任职<见演讲 25 )。 

到1962年逝世为止，他在应用统计和理论统计的谇多方而写 
了大量的书和文章。最著名的统计书 是 StathHcd Method for 
Research # 。 4 打 5(1925 )和 The Design of ExperimenU(l^Z5) 0 

他的工作使他在统计界遐迩闻名，并给他带来大量的奖品和荣普 & 
195 2 年他被册封为爵士< 

我们已经说过费希尔于 193 3 年接替皮尔逊 任大学学院的 
高尔登讲席。1943年他回到剑桥大学担任遗传学 Arthur Bal - 
four 讲席。他于1郎 7 年退休并于几年之后接受澳大利亚阿德莱 

德政府数理统计组一个研究员的职位。1962年他在那里进行一次 
手术后去世。 
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於 .4 皮尔逊和赀希尔之间发展起来韃争吵哄动了统计 
界有好儿年。没有怠思去确凿地确定争吵是如何实现的。然而它存 
在的这个事实是统计史上一个重要部分，而任一个读过费希尔和 
皮尔逊著作的人部会知道这一事实。 E*S_ 皮尔逊 [6] 提供了争论 
起因的一些有趣妁线索，包含在费希尔， “StudenP 和皮尔逊的往 
來信札中 。 

费希尔和皮尔逊的不和不光涉及个性还涉及统计的思想。皮 
尔逊学派的观点，特别经过 ( E-SO 皮尔逊和奈曼的修正和发展， 
导致把统计看成一个作出决策的科学，而费希尔的统计后裔更多 
地把统计想成数据分折和取得意见的科学。我们将在33讲中进一 
步讨论这些观点。 

小结 Karl 皮尔逊<1857〜1936> 和 R * A . 费希尔 （1890 〜 
19 S 2) 在他们一生的部份时期内是同吋代的人，并是统计拓荒者的 
M 路人。在费希尔开始以前，皮尔逊 已绞迠 立了他的声誉 a 在 
1卽 4 年，皮尔逊受论敦大学学院骋任为该校应用数学和力学讲 
份“ 1901年他编锝了 Biomelrika 筇一卷并于1911年在伦敦大学 

学院设立了应用统计系。在 m 2 年费希尔毕业于剑桥大学并发 
衮了他的第一篇论文 5 并于1915年发农了他的第一篇统计论文， 
关于样本相关系数的分布。 

在 U 1 &到 1&19 年间皮尔逊和费希尔发生严重的分歧并且从 
未得到和辟•由 1919 到 1933 年间费希尔在罗瑟姆斯坦特建立实 
验统计的基础。在同一时期，皮尔逊在大学学院的系发展得很顺 
当。皮尔® 1郎3年退休；三年后去世。在1933年 费希尔 成为大 
学学院优生学系主任 ^ 

两个人都对统4做了臣大的贡献，然而他们对科学和对统计 
0勺观点不同，在敁种程度上，统计的这些不同观点坚持直到今天 # 
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演讲33 


推断对决策 

在1950年沃尔德写了一本书名为 Statistical Deci¬ 
sion AMfio 似 [ S ]， 它在统计想法上引入一个新纪元。沃尔德的理 
论把统计工作者或统计使用者放在一个作出决策的位置上。数据 
要进行分析并用以达到一个可能的决策集合 * 

这样的提法是与奈曼-皮尔逊假设检验理论 〈接受 H 。 或 HJ 
相一致的，也被许多统计工作者所接受，认为是描述各种统计的 
一今基本方法。这就导致称统计为不确定情况下作出决策的科#。 
沃尔德显然在设想他的工作是一个统一化的统计理论。在 [3] 的序 
言中，他说^ 

除了以上的结釆外，一令较大的进展是把实脸设计归为一玟 
泱策问题的一部分。 

费希尔对沃尔徳的决策论包括实验设计的建议很反感$他坚 
持说虽然决策论可能适用于工业和技术，它对科学工作是不适宜 
的》在他的书〔1，页 100] 中他说 

……自恭科学只能由负 f 的，独立的思想家来胜利地进行，并 
把他们的理解力和想象力应用于可验证观察的 f 子知解 释。这样的 
话，仍然会是正确的。这神责任可以托付给一个带有决策函教毯 
序的庞大计算机的想法是属于一群远离科学研究、想入非非的人。 

与得出一个决策相对立，由统计分析获得信息的过程称为统 
计推断.统计推断和统计理论的关系已被 Meng 的!：2]阐述清楚， 
当他讨论推断时，他引述到英国的费希尔学派。或许这是确当的， 
因为许多推断统计的想法可以追溯为费希尔的想法。另一方面,1'艮 
清楚，统计作为一个决策科学这个概念更直接地与奈曼-皮尔逊理 
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论相联系* 


35,2在早几讲中,我引入了估计，检验，和区阅，它们是统计 
推断中的基本分析.现在考虑某些简单的决策问题，并介绍现代 
决策理论中的若干要素。 

为了工作的需要，我们准备买一辆汽车。我们计划使用这辆 
车两年，行驶 40,000 PM * 我们缩小车的选择到两辆:汽车 A 车价 
5, 000 美元，平均每加仑汽油行驶 20 哩；汽车 B 车价 6, 700 元， 
平均每 加仑汽 油行驶 40 哩。如果我们关心的只是车价和两年汽 
油费的总和，我们应选哪一辆？没有汽油的价格是无法铋决这个 
问题的 。 考虑用三神坷能的平均汽 油价: 一美元一加仑，二美元一 
加伦 ，和 三美元 一加仑 • 表 3 L 1 给出二年时间的总费用。 

表33 . 1 总费用——汽车决策问战 




rt :由 

价 格 





汽车 A :- 车价000用2, 000加仑汽油 

R 车 B :车价％, 700用 h OOfl 加 K 汽浊 

37,000 

S 7.7&0 

$9,000 

SS .700 

S 11.000 

S 9.7 C 0 


我们现在有作出决策所依据的信息。如果我们认为汽油平均 
价格约为$1，我们应选择汽车 A 。 如果约为$2,我们应选择汽车 
B 。 不知汽油是什么价，那应怎么办？ 

一稗法则称为极小化极大法，是对每一可能的决 
策考虑最坏的可能情况状态，然后选择那个对最坏状态来说 M 最 
佳的决策 & 就是说，它考虑汽车 A 和汽车 B 最大的总费用，然后选 
择最大总费用是全体最大总费用中最小的 〈极 小化极大法）那辆汽 
车。汽车 A 的最大总费用是汽车 B 的最大总费甩是 

因此极小化极大决策是汽车 B ， 如中所说， 
统计工作#一般 V 推荐这一法亂因为它太悲观了。 

另一法则，称为贝叶斯法，要求对汽油的价格给出一组概率 • 
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显然，在这一例子中这些概率足相倌程度的 Rfi . 假定我们强烈 
惑到汽油将保持低价，因此我们指定和 I 为汽油价格$1， 

£2,和昶的概率，下一步我们计箅汽车 A 和汽车 B 的平均总费 
用。贝叶斯法选择平均总费用最小的那辆车。很容易验证 

平均（汽车 A 总费用 ） =(-|)(7, 000) -h y (9,000) 

000) =7750 

o 

平均（汽车 B 总费用 ）=8075 

于是对指定的概率，汽车 A 是贝叶斯决策。概率的其他选择可能 
会导致汽车 B 为贝叶斯决策。 

r 

es .3 上一个例子说明一个决策问题的许多特点。这里有 一 
个参数空间（汽油的未知价格>，一个决策空间（汽车 A 和汽车 B )， 
和一个费用函教或描失函数(表33*1)。然而这个例子并没有包 
括那些告诉我们参数的部分信息的数据。考虑另一个例子，它的 
提法包括数耪.我们将给出一个简化了的、可能发生在一家制造 
商行的抽样检查中的 问题。 

如果产品批的质量很低却通过了检查，将慼到丧失顾客良好 
意 S 的损失是巨大的 e 没有 M 过捡査的产品批需返修一好批的^ 
成本比差批的略为少一些，表 33.2 表明可能的情况。 



*35.2 

损失 




不合才各 

r^r -、■ 


0.05 

0,10 ( 

- 0 15 

通过检迓 

k 

0 

1000 

IOCO 

返 修 

300 

soo 

SflO 


从每一批中取一个两件的样本，并令 x =观察到的不合格产品数。 
考虑下列两神可能的决策 I 
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决策 1 若 : K = 0, 通过。 

决策2 若 X = 0 或1，通过。 

农抑.3给出对每一批，每一个决策，通过或返修的概率。把损失 
乘上概率 B 相加便得到对每一种不合格品率和对每一种决策的平 
均损失(风险）。例如，当不合格品率为 0.10 时，决策1的风险为 

风险二 V 0_90：>\1000> + Cl -(.90> a ](500) 

= 905 

这徉做,我们得到表 3 S *4 所给出的全部 风险。 

决策1是极小化极大决策。如果0.05, 0*10, 和 0.15 的概率 
分别是0 + 90,0,05,和 0*05, 我们求识叶斯决策，用这些概率我们 
得到风险. 

决策 1 114.6375 

决策2 99*8625 

所以对给出的概率，决策2是贝叶解决策。 


表33+3 通过戎返妗的权半 






0 + 05 




决铕1 决策 2 决策1 决策2 决范1 决取2 
{』5) 2 卜（.05) 3 <.90> ! l -( rlO ) 2 (. S 5) 1 l -( A 5 ) t 

i-C »5> 3 ( 力 5y C-10) J 1"(.S5) - < + lS) i 







33.4 -看来 Nj 介绍的决策论興备必耍的成份来处理参数估 
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计，检查，和区间。事实上，在科学工作巾，春來这只是在一神形式 
意义下是如此的。研究人员一舣并不知遒他们的工作可能会遇到 
么损失（或奖励>,他们也没有一组明确的决策或荞可能参数仍 
的一组概率。在另一方面，对需要作出商业决策的工作，决策论狞 
来是很合适的0 

小结在统计发展成一门作出决策的科学的道路上，沃尔徳 
的书 S afisticat Decision Functions 是一个重要的界标。费希尔抗 

拒把统计系统化到这样的程度，很淸楚他宁愿更多地把统计界作 
数据分析和形成意见。从数据萃取偯息可称为铳计推侃作出 
决策却不能称为统计推断^ 

统 it 决策论可筒述如下，一个人在面对大白然的几种未知状 
态的情况下，有几种决策可供选择。对每一行动-狀态对，作出 
决策的人会受到一个损失 （可能 是负的 h 在样本数据的基础上, 
从可能的决策中作出一种决策。各个可能样本上的损失期望仉称 
为风险。作出决策的人希望按架种方法极小化他的风险，讨论 r 
陴种方法:极小化极大法和贝时斯法。极小化极大法是选择这样 一 
个决策使极大的风险极小。贝叶斯法是选择这样一个决饺，使期 
望风险(对大自然各种状态的一个概率分布)为 最小。 

虽然许多统计何题可以正确地设想为一个决策问题，但统计 
决策论却没有能成功地把统计方法统一起来. 
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5. 已知表 33.2 中的损失函数，假定从每一批产品中抽取一个两件产品 

的样品，对下列决策作一风险表。 

麟 1. 若 x= 0,让这批产品通过* 

决策 L 若0或 1. 让这枇产品通 it 
夾策3+ 若0,1,或2,让这批产品通过， 

有了这一风险表，对习叼4中的三组概率，什么是贝叶斯决策？ 

e . —个*藏家正在考虑购买一幅为著 g 画家所画的名画。这幅画标价 
五千美元^如果兑其品，它可值一万美元，如果晦品，它就一钱不值> 还 
U , 买到一张假画或者没冇能另下一张真画都会损害她的名誉。损失表如 

下* 


真品(臾元 > 赝品（美元) 


不买 


SrOOO 

L 000 



她跑去寻找一位鉴赏家，他能以概率 0.95 识别一张真画和概率 0.70 识别 一 
张假画。对*下列三种决® I 乍一风险裘 

决策1 以概率 f 买， 

决策2 如果鉴赏象说足真品就买， 

决策3 不买 • 

7 . 对习题6 r|i 纟:] RA 織， 求极小化极大决策， 

8. 用习题6中的风 BSSt 和下列三组溉率，；贝叶斯决策 t 
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演讲34 


卡方 

34.1 在这些演汫的讲解 H 程中，我们已介绍了几个著名的 
统计量，诸 如相关系数， Student 的 t 和 Snedecor 的 F , 虽然我 
们以前提过卡方统计迸，我们把它延迟到现在以便作一个较全面 
的描述。卡方分布是一个偏欹的分布，它依赖于一个参数，通常称 
为自 由度， 其值列成表 A . 具有卡方分布的统计量产生的方式很 
多；在本讲中，我们将用例子来说明卡方的许多应用中的某几种。 

34.2 在年皮尔逊发表了一篇 关于卡 方应用的文章|： 3 ] 
说明它用在检验一组数据来自一个完 全明确 的分布的假设。例 
如，我们可能有一组度量数据，它的直方图着来有些象一个具有 
明确参数的普哇松分布。我们愿意有一个检验来度量数据支持咎 
哇松假设 到什么 程度。皮尔逊提供了这样一个检验，步骤如下： 

1， 把数据变异的范围任意地划分成若干 E 间。 

2,数一下每一 E 间内观察的个数，记这些个数为 0^0 a ，…， 
0 t ， 其中 k 是区间数。. 

3* 根据所假设的分布，计算每一区间的概串。 

^对每一区间计鉛观察的 期望数 这可用样本大小 n 梁 
上所锌出的概率而 得到: E ^ nP ” E 2 - aP is 等等， 

5. 计算统计皮尔逊证明这一统计量的 
分布可用表 A _ S 的卡方分布很好地 近似； 因此，这个统计量大家 
都知道叫卡方统计暈，并记之为; 

6 * 由表 A .匕找出一个比所观察到的一个有更大值的 概率以 
得出观 察显#水平* 皮尔逊用 k -1 (区间个数 减一〉 为自由度，不 
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论参数是知道的还是由数据估计得来的 。 然而，费希尔[1， 2] 证 
明了对每一个由数据估计得出的参数，从自由度中减去一将会得 
到一个更好的近似。 


34.3 我们用两组数据来说明上节所描述的拟合优度检验。 

在表 L 1中我们提供了 Bortkiewicz 的被马踢死的数据.为了 

检验数据来自一个普哇松分布，我们用样本均数 x =0.61 来估计 

参数， 用普哇松分布表，我们于是可以计算概率以及这些概率乘 

上 n = 200 的期望数。表34,1给出这些数。由表34,〖的最后两 

行,我们算出/统计量。 

rl _ y ( Q - E；) a 

= 0.7920 

由表 A +3,我们见到观察星著水平相当大 （用 k - 1 — 1 =3自由 
度 >，所以普哇分布假设是可接受的， 


表 34.1 P 的计算——普哇松 



考虑表34,2的数据来自一个正态分布的假设.我们估计均 
数和标准差 

表34,2脑重童分布① 


脑重 He 克） 频数 


<1100 0 

llOfl^USO I 

1150〜12 00 10 

1200^1250 21 

12B0^J3O0 44 

1300—1350 S3 

1350^1400 ge 
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续表 


脑蚩镫（克) ， 兒数 


14C0^U5O 

72 

1450^1500 

60 

1500^-1550 

26 

1550〜1600 

25 

1600〜1650 

12 

1660^1700 

3 

1700^-1750 

1 

1750< 

0 


①摘自 Pearl R. (1905) “Biometrical Studies on m&a I- Variation a&d 
Correlfttiou in brain weight^Btotnetrika 4 由数据 * 


x = 1400,4807 
5 = 107.3042 

应用这两个估计值，我们由表 A , 3查得概率并乘上样本大小 n = 
416以获得期望值，衷 34*3 列出这 些值， 

___ * 54.3 f 的计算一一正态 

区间 Oi Pi El 


<J100 o 

1100^1150 1 

11 S 0^ J 20& lft 

mo 〜 1250 21 

1250 〜 mo 44 

13 如 〜 1350 53 

1350^1400 86 

1400 〜 1450 72 

1450^1500 60 

1500 〜】 550 28 

1550^1600 25 

1600 〜 1650 12 

1G50 〜 J700 3 

1? Q 0^17 S 0 1 

175 0< 0 


0.002 & 

1.0*1 & 

0*0&73 

3,0363 

0 + 020S 

8+ 6 咖 

o + osoi 

20.B116 

0 0»3& 

3S.G043 

0.145S 

60.5696 

o.iaoa 

7H128 

0.1772 

73-7152 

0,1466 

60.^856 

0-0954 

39.6864 

0.0494 

20.GS04 

(M215 

8.S440 

0*0073 

3.036« 

0.0020 

0.8320 

0.0006 
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4 

5 

7.S065 

7 

S.S22S 

6 

2,4£39 

22 

£ 

6 9677 

6 

8.5161 

6 

4 

2.7097 

24 

16 

13.0645 

H 

15,9677 

IX 

10.SS71 

4 

S.OS05 

45 

8 

9.SS06 

19 

11.7097 

6 

7 9839 

0 

3 + 7258 

33 

3G 

44 


14 

134 


三年级 

四年级 

理硕士 

博 ± 
总和 


由表我们綷得我们的统计量;^ = 11_6945,并山衷 A * 
8我们见到 k - 1 - 2 = 15〜1 - 2 = 12 d ! 取得更大一点值的概率大 
约0_5、因此，我们得出结论说，一个 IE 态的假设是合理的。 

34,4 卡方的另一应用是检验一个按两种方式分类的表上行 
分类与列分类的独立性。我们再给一个例子。在一个有大学生和研 
究生参加的大班统计学课，打分是戟师的一个大问题。某些大学 
生觉得打分方针优待研究生 a 考虑表 3 L 4的数据。记录下对四个 
不同级别的学生所打的每一文字分数的个数，要问分数的分布是 
否对不同水平的学生不同。假定得到一个 A 的概率是与学生的级 
别独立，那么 

P (三年级和 A ) = P (三年 级> P ( A ) 

在独立的假 设下， 这一概率可佔汁为 (36/124) (22/124>且期望数 
可用它乘上124来估计。因此三年级 A 这一方格的期望数为 (36 V 
(22)/124 = 6.3871. 类似地可求得表中其他期望数，然后算出卡 
方统计量/ = 19*0684。 

一个有 r 行和 c 列的表的自由度只是 ( r - l )< c - l ) a 这是从 
以前关于自由度的规则推出的*在独立的假设下，我们只诹估计 
行概率和列概率*由于衧概率之和为1,我们只需估计这些概率 
中的 r -1 个，类似地估计 c - 1个列概率。因此自由度是 

— 1 一 （r — 1> ■ (c — 1) = vr — l〉（c — 1) 

*34,4 独立性检辁 

A B C 0 总⑴ 


OE OE OE OE 




对目前这个例子，自由度是 9, 由表 A 』， 9自由度的卡方趙 
过 19*0684 的概率约为因为这一相对小的值，我们倾向 
于接受分数的分布不独立于学生的分级这个结论。 


34,5近年来，其他拟合优度统〖卜量比卡方更优先为人采用， 


然而卡方统计量仍用得很广，所以对它有一定的了解是必要的 # 


小结皮尔逊提供了一个卡方拟合优度检验，以检验一组数 
据足否符合一个假设的分布。由样本数椐构造一频数分布。对每一 
组或 K 间，按指明的分布计算期望或理论频数,然后用公式芝(0- 
E> a /E 计算卡方统计量，其中 O 代表观察頻数 ， E 代表期望頻数， 
自由度(如费希尔修改过的>是(组数 ）-1 -(被估汁的参数个数 )* 
卡方统计量的另一用处是检验一个闽种方式分类频数表中两 
种分类准则是否独立，在这一情况中，任一方格内的理论频数是 
《行 咛总和 ）（ 列的总和）/ 〈表的 总和)。 

卡方统计董的自由度是 ( r - l >( C - l >, 其中 r 代忐行数“代 
表列数。 
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习 题 

1 . 验证表別. 1 中的卡方计箅和所 得到被 马暘死数据的现察显着水平 & 

2 . 试 fflf 哇松分布来拟合 Snnkut 的酵母数据（表 12 * 3 >,并计興:卡 
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方统计 S 和观察显著水平以检验拟合是杏良好 

3验证 §34.4 表中的自由度确能由公式 k - I - (被诂计的参数个数)得 
到 fr - l )( c - l )。 

4. 验证 §34.3 中 f 和 s 之值和表 34.3 屮卡方的计箅^ 

5. 布连续分栢的情况，分成 E 间的选择是任意的，所以对卡方检验是 ff 
一些影响的，对表 34* 2中的敖据按 E 间1100〜1200, 1200〜1300,等等，嵬 

新计算卡方值，你是否被引导到数据服从正态这一相同的结沦？ 

6. 检验用正态分布来拟合表 5.2 中数据是否良好？ 

7. 社会科学家常常调査父母的态度对儿童态度的影响。对一个城市里 
的中学生进行一次调査询问他们参加敉堂活动的问下面是敎堂的出席人 

ft . 



—周一次 7 

一 月一次 1 

难得一次 



计算卡方以检睑父母出席教堂与儿童出席软堂的独立性，求观察显著木平 

8. 中学足球球员波询问问题以确定他们毕业后升大学的计划，研究员 
感兴趣的是中学足球比赛胜负与他们选择的大学足球比赛胜负之间可能有 
关系 * 下面是学生们中学足球队和他们所选择的大学足球队的季度记录， 


+ ^ %!)利3 * 


大学 ㉝ 严录 


0^50 




2&^50 


50〜75 


75^100 


5 hm 



计算卡方统计置和观察显著水平以检险独立性， 

3. —个民意研究公司调査了群众时减少州税的态度，计算下列数据的 
卡方统计 a 和观察显著水平以检验独立性* 
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㈣ 


反对 


州的雇员 m si ? 

不是州 的雇思 476 109 


10. 在一所办公室大楼内工作的人在十月1 —月、四月被问到他们的 
办公室是否温度适宜^太冷、差不多、太热、计算卡方迚立性检验和观察 
显著水平。 



十月 

一月 

四月 

太冷 

231 

168 

m 

差不多 

66 

89 

79 

太热 

148 

m 

136 


11. 人们被 问到关于公立学校教师工资的意见(太 髙、 楚不多、太低 h 
被问到的人，有些是教师、有些直系家属中有教师、和其他与教师没有密切 
关系的人。对下列数据,计算卡方统计 S 和观察显著水平，以检验独立性 # 




教呵 

有关系 

无关系 

太 

高 

Z 

102 

621 

兹不多 

37 

37* 

B 7 S 

太 

低 

316 

ZU 

309 
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因子分析 

35.1 因子分析早期袅由高尔登（1肋8> 和皮尔逊 (1901) 的贡 
献而创始的，但它的发展和推向现在状态主要是由心理学家们的 
努力」 9 04年 SpearmanE； 幻提出度量总智力的想法。假定我们有 
某人的数学、科学、艺术三个智力倾向性分数 UptUude scores). 
按照总智力理论 (general intelligence theory) t 这三个分数是 
这个人的总智力分数和这三个领域内特有的倾向性分数的一个组 
合。 

35-2 为了进一步深入，我们必须讨论一些准备概念。回忆 
—下 ，一 个标准化变量是一个均数为譽，方差为一的变量 & —个变 
fl 减去它的均数再除以标准差就成为标准化变贵。在心理学和其 
社会科学中，很多地方用到标准变量，而在这里的因子分析的讨 
论中总是假定观察变量是标准化了的。我们试图用一个基本的， 
构成基础的，但不可度量的总因子来衷达这些标准化变量。 

35. S 候定因子 结构是已知的 ，并 且敖学、科学、艺术的讳准 
化倾向性分数 2 a ，Z 3 由一个 砬准 化总智力分玫 F 和诗有的帧 
向性分数 e t , e a ， &的线性组合给出如下* 

Z 2 (科学 ） = (K8F +e 2 
Z〆 艺术 + 

我扪还假定 F 和三个 e 是不相关的。 

F 的系数称为因子负 荷系数 〜一. 这样称呼的意义是它们描 
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述了基础因子 F 中所 《负 荷”的 A ， Z £ ， 和 I 部分 e 因此数学和 
科学分数与因子 F 的关系比艺术分数与因子 F 的关系更强 & 所以 
我们可能会把因子 F 同数学和科学倾向性结合在一起。这个意义 
可以说得更精确些，因为这些因子负荷系数给出请 Z 与 F 间的相 
关系数。因此 Z , 和「的相关系数是0.9, 是0*8，匕和 F 

是0.1 6 


因子负荷系数的平方称为公有性 ( commuiiality ), 也有直接 
的解释。它们给出 Z 的方差中由于公共因子 F 的原因而产生的那 
一 部分。方差中的剩余部分称为特有性 ( specificity ), 对手边的 
这一例子，我们有下列数据： 


总的方差 公有性 


特有性 




0. S 1 

0,64 


0 + 19 



例如，我们可以说艺术倾向性分数的方差有如％是艺术所专有， 
而仅有是由数学，科学，和艺术的公共因子所引起。 


35.4 Spearmafi 的工作所建议的简单模型很快就推广到包 

栝多于一个“总智力”因子的情形假定我们 有两个 不相关的总分 

数匕和匕，再假定标准化分数和厶给出如下 

Z | = 0, 9P I + 0* iFj + 6| 

Xt% 57 0 * 8?| + Q * + 

Z3 = 0+lK| + 0* 8Ft 6^ 

把因子负荷系数理解为相关系数可直接推广，而事实上，这对 
因子提供了某种 解释。 总因子 F l 与 Zl ， Z £ ， 和 Z , 有相关0*9, 
03,和 0*1， 而总因子有相关系数0.1，0.2, 和 0.8. 这就建议 
Fi 可能是一个科学的因子而可能是一个 审美的 因子。 

还可能从因子负荷系数计算公有性和特有性。这要对因子负 


* 
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符系数矩阵 A 作矩阵乘积 AA / 

r 0-9 0.1 1 


o 


对这个例子， 

f 0,82 0,74 0.17 


AA " = 


0,8 0.2 

0 .T 0*8 


0,9 O.S 0*1 
0:1 0.2 0*8 


0.74 0,68 0.24 
0,17 0*24 0-(>5 


A _ V 主对角线元素给出公有性所以对此双丙子換型我们有 


总的方差 


公有性 





35,5前几节里，我们在讨论中把因子负莳系数 C (诸 F 的系 
数>看作是已知的，并把诸 F 和诸 e 想象为可以 fi ： 贵的。事实上，通 
常的情况是，我们既不知道因子负荷系数，也不能度量渚 F 和诸 e ; 
我们仅能度量渚 Z 。 从诸2的度量，我们必须估计诸系数，诸 F ， 
和诸 L 这可有许多方法来完成，稍一浏览因子分析的文献陡可见 
到有许多方法奸用。在统计计算程序包中估计方法很容易得到。 

因子分析的应用在许多情况中是成功的，特别是当诸因子 F 
是事前知道的或者受怀疑的，在另一方面，因子分析曾被用来分析 
许多集合的数据，希望能发现所包含的因子，至于这呰因子是汁么 
事前一无所知，在这类情况中，成功的使用是不多见的。 

a 

35*6 另外一种处理因子分析的方法是用 I )维几何。科学小 
说的作家们引入四维去创造幻异世界，其思想是很引人入胜的。 
在很现实的意义下，我们确实生活在一个多于三维的世界，不过不 
是科学小说中的世界罢了。 

为了说明多维空间的思想，考虑人的一个总体。对每个人，我 
们可以得到许多物理度量如髙度、蜇量、腰围 等等。 我们还可以得 
到智力商数和倾向性測验分数。假如在这些之外还能得到一些特 
征如勇敢，坚韧，诚实等的数宇度量.那么可以把每个人设想为… 
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长列的数字，现在设想一个轴表示长度 ，一 个轴丧示重量 ，… ，一个 
轴表示诚实,我们可以把一个人的分数画在一个 rt 维空间中，因而 
每个人可以设想为 II 维空间的一个点。人的一个总体就是点的一 
个 群体， 象一个 n 维气球。本质上相似的人的总体就是一个紧密 
挤在一起的群体，而不同本质的人的总体就构成一个松散的群体。 
可以认为是典型的、很能适应环埯的人都是群体中心的点。不能 
适应环境的和不正常的或者例外的人是群体边缘上的点。 

如果我们得到50人中每个人的三个分数，我们可以把全体数 
据集合设想为三维空间中 SO 个点。更一般地说，我们可能会有 n 
人中每一个的 p 个分数，便可设想我们的数据是 p 维空间 中的 n 
个点。这 n 个点构成 p 维空间中的某种类型的群体。作为典型，我 
们希望它是椭球 形群体 （一个 p 维 橄榄) ，并且试图寻找它的 主轴。 
大多数的变异集中于第一主轴，次多数的变异集中于第二主轴， 
余类推。当然，我们用几何直觉来想象，但所用的方法是代数的，这 
个方法称为 主成份 （分 析〉 ，是皮尔逊1901年一篇文章 [3] 的主题。 

小结 Spearman 想到了测检分数是一个总智力因子和数 
学、科学、艺术、音乐等特有因子的组合。这就导致一个因子 供型， 
在其中，一个标准化的测试分数表为一个常数乘上一个标准的不 
可度量的因子分数加上一个标准的不可度量的特有的分数。常 
数称为因子负荷系 《, 并且也是可度量的测试分数和不可度量的 
因子分数间的相关 系数。 测试分数的方差是两个分量之和 t 一部 

分为全体测试分数所公有的称为公 有性， 一 部分为某一测试分数 
特有的称为特 有性。 

单因子模型后来被推广到允许有几个 因子。 没有一个计箅程 
序，计算工作将是繁誑的，但好几个程序是容易得到的。 
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习 题 

1. Fi 和尸2是两个互不相关的因子分数(标准化变量、标准 H： 分数 Z t , 
h 和2;为 

Zi = 0*8 Fi +0. lFj + ei 

Zi = 0 .lFi + 0*7 Fi + e , 

Zj = 0 . 2Fi + 0 * 6F2 + 6j 

a . 什么是诸 Z 和诸 F 之间的相关系数？ 

b . 什么邑用诸 Z 来表示的诸 F 的基本解释？ 

c + 计算公有性和特有性。 

2* 一个学生科学研究工作者在他的署假中进行了 一次野营者的调 
査。他访问了不苘营地上其他野营者并得到一张调査表上有关他们对假期 
活动惫见的回答。到秋季回到大学后，他应用计算中心提供的因子分析程序 
分析了他的数据并识别了两个因子，下面列出系数。 


步行旅游 

0.56 

- o + o & 

钓鱼 

0,47 

0.03 

划躲 

0.39 

0-10 . 

游泳 

0+45 

0.06 

搜谈 

0.07 

0.56 

导游 

0.22 

0.34 

野营杂务 

0,14 

0.4! 

营火会 

一 0.09 

0,51 


a . 你将怎样理解所识别的两个因子 t 

b . 计算公有性和特有性， 
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哪两个问题是度 a 掌握的？哪三个问题是度置使用能力的？ 

5. 一个大的大学本科的学生自愿参加大学代数，会计，英文作文，美囯 
历史，和化学的标准考试。两个主要因子的因子负荷系数给出如下，问你将 
如何理解这两个因子？ 


_ 因 子 

考试 1 


S . 大多数计算中心有统计程序包好用，并且因 T 分析程序常是包括在 
内的。一个因子分析程序的使用者手册对…个涉及五个实验材料中每一个 
的三个度遢的问把给出其因子负荷系数如下 a 



因 


子 

卖险材料 

1 

2 

3 

1 

2 

0.3 

0*7 

0.7 

0.1 

0.1 

0.2 

5 

Q.S 

0+1 

0,1 

4 

5 

0-2 

0*1 

O 

03 

0.1 

0,1 


计箅三个因子的公有性和恃有性。那一个实验材料可以作为因子1的典型 
代表？作为因子2的典型 代表？ 

4) —班20个学生的一 次考试 有五个问题，其中两个是置度教材的掌 
握，而另外三个是度量学生使用这些材料的能力，对这两个重要因子的因子 
负荷系数经识别如下。 


子 


0 


53 8 1 2 G 

& 7 1 1 8 

■ ■■ L r 

o Q o o o 


15 8 9 9 
9 18 7 0 

'■+■■* 

o o o o o 


0 

问 


2 9 16 8 
5 5 6 6 & 

H-4 + + 

o o o V o 


* 


■ T 

30 


* 


o o o o o 


微 S 
8 
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判别函数分析 

36 + 1 对许多人来说.他们热切希望能对证券市场作出上升 
期和下降期的 预测。 如此做的尝试常常要借助于过去证券市场价 
格的某种函数。类似地，我们希望能从屮学成绩记录识别出大学 
一年级新生中可能中途退出和可能坚持读下去的学生 t 作为另一 
个例子，一内科医生希 望能从 IS 药记录上判别出病人中哪些人可 
能，哪些人 不可能 受到心脏病的 袭击。 对这些和其他许多判别问 
题，有一定的成效，但我们仍然盼望能把判別做得更灵敏些，在本 
讲中，我们将引入统计判别函数，它曾被用来做出这些例子中所提 
到的那种判别。 

—般的方法是使用来自两个或多个已知总体的数据，其中每 
一个体属于哪个总体是清楚的。于是人们想出一个判别函数，它尽 
可能好地把样本中的个体划分到正确的总体中去。如果划分非常 
好的话，人们便有信心正确地划分一个个体，仅知它是来自这几个 
总体中之一，但不知道是哪个明确的总体。 

36.2 我们现在将用一个例子来讨论判别函数分析的某些思 
想。考虑表 3 G .1 中的数据，它给出 24 个大学生的智力商数 ( IQ > 和 
中学的平均绩点。十二个在他们大学一年级时中途退学，另外12 
个继续读到二年级。 

已知这些数据，我们开始寻找一个判别函数。在我们考虑 
X ^ IQ ) 时，我们的希望开始下降， 两个样本均数 （117. 58和 
113.9 2 >间有一点小差异，但一个 t 检验立刻显示差异不显著而足 
由于机会产生的。郎使差异显著，继续求学的学生的平均 IQ 低 
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表 ％- 


k 淬一年 K ， 



Xi(IQ) 

X 2 ( 中学成绩） 

Xi(IQ) 

: X 2 ( 甴学成绩 ) 

109 

2,60 

107 

2.5* 

1D8 

2.C« 

105 

2-6 & 

113 

Z.54 

106 T 

2.91 

115 

2.85 

Hi 

2,70 

116 

2.79 

112 

2.86 

114 

3.03 

m 


119 

3.00 

114 

3.11 

in 

3.25 

m 

3.10 

122 

3, IS 

113 

3-26 

122 

3.37 

119 

3.25 

m 

3. 3 !； 

us 

3.27 

123 

3.62 

121 

3.49 

总和 1411 

S6 + 14 

1367 

36,38 

均抆 n?-5s 

3.012 

113+92 

3 + 03 


于中途退学的学生的平均 IQ ， 以致我们倾向于怀疑这些结禺。 

当我们察看 X 2 (中学的平均 绩点〉 时，我们遇到一个类似的倩 
况。样本均数之差很小，而用一个 t 检验就看出是不显著的。 

我们的希望落空了 t 进一步学习判别函数会知进把变 fi 联合 
起来考虑是有益的，这一点我们还没有做。我们分开考虑了 和 
我们决定再努力一下。 


分祈两个变量最简单的一个方法是把数据绘成一张散 
布1?1，如图36, J ：。 绘出了这个图,我们在 X !和毛的基础上判别中 
途退学和继续读下去的希望就大了。从散布图我们可以见到数据 
可能来自两个部分重迭的分布，我们将用一条直线把数据尽可能 
地分成二个群体。这就象从两个山灯中间的一个山谷向上看望去 
区别它们*当我们从山脊的横里看过去时，耍区別它们就有困难, 
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如同我们单看\(或 x a > 是不能区分中途退学者和继续求学者 

白勺 • t 学成琐 



敢 布图： 大学一年级学生 

在图我们画了一条直线。这条直线只是看了这些点 
画的，并无任何理论依据。事实上，关于线的选择曾做过大量的理 
论研究，但在本讲中将不讨论。注意线穿过点（100,2,15)和（130, 
3*75> 0 于是知道斜率是(3.75-2*15)/(130-100> = 0.053,我们 
还算出 X a 截距为2.15- (100>/(0_053)= - 3.15。因此直线有 
方程 

X a = »3.15 + 0,053 Xi 

或等价地 


0.053X^X2^3*15 
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我们还可确定位于直线上方的点适合 

0,053 X t - X t < S ,15 

而位于直线下方的点适合 

这样我们就得到一个判别 a » 0.053 X , - X ,和一条 《分规划 

分一个学生为中途退学者，如果否则就是 
一 个继续求学者 0 

S 6.4 F 在苌看一下这一划分规则对表36,1中的数据有多 
好. 当然 ，我们可从图36_ 1看出直线把三个继续求学者和三个中 
途退学者放在错误的一面.然而对数据中每一点，值得算一下所 
选择的判别函数值.这些值连同结果的划分给出于表 36.2 中 . 

由表36_2我们见到，我们的判别函数做得很奸.我们把这一 
操作列于表 36*3 中， 


_ 表 36.2 判刑分析 _ 

中途逍 i 继续求学 


函数 

刼分 

函敢 

划分 

3,277 

退学 

3-131 

求学 

3-044 

求学 

2.91 S 

求学 

3,449 

退学 

2,703 

求学 

S .23 S 


s.m 

退学 

3.358 

退学 

3 ■㈣ 

求学 

3.012 

求学 

2*7** 

求学 


退学 

S .932 

求学 

s.m 

退学 

3+154 

退学 

3 + 3]6 

退学 

2.991 

求学 

3*0 S 6 

求学 

1,05? 

求学 

3.222 


Z . 24 B 

退学 

3 + U 4 


3.92 S 



表36,3 


群 体 


判别@的操作 

M 


分 


IH 箱教 


中退学 


9 


错误教 

3 

Z 


4 
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36*5 对更多的 X ®， 本 讲中所 给出的 简单方 法将不 适用。 
但我们仍可用它帮助我们的直觉。我们可以 设想涔 个 p 维的部 
分重迭的点的群体。我们试图在它们之间通过一个平面把它们分 
成 M 个群体。当然这可以用代数来具体完成，并且一个平面是我 
们变量的一个线性组合。计箅别函数有计猝机程序可用 & 全部 
理解如何做要求有统计和 p - 维几何的知识，但对一个仅知 本讲中 
简单方法的人，判别 函数分析是有用的。 


OT .6 古生物学家广泛应用判别函数。给出一块骨头断片 


(牙床骨，肘骨，等等 用所有确定年代的方法都判定它很老了，我 


们感兴趣的是这一断片是否是人身上的， McHenryC 5] 对这一类 
事物作了详细的讨论。 


3 e *7 在 ] 的 6 年 Mahalanobk 和费希尔发表重要的文芾对 
发展判别函数作出贡献。 

小结通常会遇到一些样本数据，它们来 ft 两个已知为不同 
的总体$需要找数据的一个函数，它对不同的样本会有相$不问 
的值。如果这个函数证明了样本是来自不同的总体，我们希 望它 
能对未来的观察按总体伟出划分。 

线性判别困数的基本思想可从绘出来自两个部 分重迭 的总体 
的观察而得到，把每一变量分开来看时往往不可能看出什么区别。 
然而，当把 N 个或多个变量联合起来考虑时，可能是一条直线（或 
平面）把总你分开得很淸楚。直线的方程给出-线性判别阔数。 
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习 题 

1. 验钲表邡 .2 中给出的判别函数值和划分。 

2. 下列数据有关 W73 年州的财改巧羌围.人 n 调杏局所 发表的 』数字 


州 

悦收 


开支 

东南方 

ij?. 

S48 

454 

Arkansas 

U9 

虜 

397 

Florida 

460 

UO 

43Q 

Georgia 


?r>s 

471 


r>3 ： 

1,816 

505 

LoutS=i^A 

K 久 1\ 

fc 1 r 

1,214 

云 54 

Missi ssippi 

520 


i9S 

North C^irolitift 

4 & 5 

52 & 

451 

South Carolina 

198 

603 

4G» 

Tenn^s^e 

422 

642 

35 (； 

Virginia 

47 & 

UZ 

464 

West Virginia 

59S 

842 

532 

东北方 

Connecticut 

560 

S f 5S0 

526 

Maine 

SSI 

i 

52 & 

MassathsisHts 

S82 

3, 10S 

602 

New Hampshire 

403 


420 

New Jersey 

4f>6 

£ h 7^5 

413 

New York 

75S 

n.aoi 

721 

Ptnfisy f vania 

532 

七 596 

530 

Rhode Uland 

537 

3U1 

553 

VermcLf 

7*K 

421 

7S4 


* 
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单位为百万美元，并且 都是按人口计 算的。 

绘一张税收对欠供的散布图，并找出一线性判别囷数以判别东北方的州 
和东南方的州 ，再试一下 税收对开支以及欠放对开支 4 使用什么看来是最成 
功的判别函数，构造类似子表36,2和36,3的表。 

3. 对下 列样本尽可能 作出最 正确按总体的划分， 用一 条规则 形如，若 
X t <0, 划分 它为一个总体 >若&><：,划分它为另一 总体。对 X 3 , 然后对 
&作 同样的工作。 其后再用 2 X , + Xz + 3 X 3 的大值和小值作同样的工作。 


总体 1 &庠 2 


Xj 


X 2 


Xi 


X, %2 x 3 


21a 
6 ^2 0 

2 5 

t Z l 

12 2 

S 2 -1 

10 0 -3 

n s 

-11 2 9 


-3 

-1 

6 

0 

z 

10 

-3 


2 

3 

2 

2 

5 

3 

30 

-3 


6 

5 

0 

4 

2 

2 

-3 

$ 
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表 A ,1 

随机歎 

表 A .2 

二项概率 

表 A *3 

累积正态分布 

表 A . 4 

Poisson 分布 

表 A + 5 

分布 

表 A . 6 

不同 a 著水平的相关系数 

表 A . 7 

F * 布 

表 A .8 

卡方分布 
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